学科分类
/ 13
258 个结果
  • 简介:基于多类别肿瘤基因表达谱数据集,从研究肿瘤与正常组织的分类入手,对肿瘤分类特征基因选取问题进行分析和研究。将决策算法应用到肿瘤基因表达谱分类研究中,尝试引入遗传算法,对决策分类规则进行优化。试验结果表明,在样本有限的情况下,该方法比单个决策具有更高的分类精度。

  • 标签: 肿瘤 遗传算法 肿瘤基因表达谱 决策树 特征基因
  • 简介:通过扩充情感词典词基数,新建中立词词典,引入网络流行词等方式丰富情感词典,提高分词后情感词匹配的准确性;以某评价类网站网民评论作为原始数据进行分词,提取相应的正向情感分数,负向情感分数,中立情感词个数,评论情感总分值等特征,通过对连续数据的规约提炼离散属性,按照信息增益最大原则生成决策进行评论的情感分类,去除小概率节点后进行两次实验,对好评的识别率达到90%,对差评的识别率达到92%。对中评的识别率达到75%。

  • 标签: 情感词典 特征 信息增益 决策树
  • 简介:该文在描述决策分类算法的基础上,叙述了决策分类算法用于网络入侵检测领域,给出了决策分类模型的构造过程,并说明了应用基于决策模型检测入侵的过程。最后用KDDCUP99数据进行实验,验证了用本文描述的方法检测入侵行为的有效性。

  • 标签: 决策树 入侵检测 分类模型
  • 简介:该文首先对决策技术相关理论和SQLServer2008BI平台作了介绍,然后对用于挖掘分析的数据源进行了预处理。利用SQLServer2008BI平台下的决策分类技术和DMX语言即数据挖掘扩展语言创建了课程成绩分析决策模型。挖掘提升图和分类矩阵对该模型的评估结果表明模型具有较高的可靠性和分类准确度,同时模型对应的一些规则和模式可作为课程教学管理及改革的重要参考依据。

  • 标签: 决策树技术 SQL SERVER 2008BI平台 ETL过程 DMX语言
  • 简介:数据结构设计的重要目标之一是提高操作速度,特别是检索速度。局部平衡的红黑、平衡的AVL等二叉搜索具有良好的检索性能,非常适合于基于内存的索引,但为防止树形结构退化为线性结构,在插入和删除结点时经常需要旋转,维护数据结构的操作比较复杂。文章阐述伸展在检索过程中通过自动调整结构,使访问最频繁的结点靠近树结构的根,从而减少访问代价,指出伸展可以作为各种线性序列的索引组织方法,能在一些需要高效索引的大工程中加以运用。

  • 标签: 数据结构 索引 二叉搜索树 伸展树
  • 简介:在数据集中挖掘频繁模式是数据挖掘研究的关键环节之一。在过去,很多的努力都集中在独立数据的挖掘上。然而,现实世界中许多实体之间总会保持着千丝万缕的关系。如何获得这些关系的频繁模式,已逐渐成为近年来研究的一个目标,我们将它称之为频繁结构的挖掘。在数据挖掘中,一个重要的方法是关联规则挖掘。它被用来发现频繁出现在数据库事务中的项集;另一个重要的方法是序列挖掘,它的任务是去寻找一个项集的序列。这些挖掘任务都被称为频繁模式的挖掘。

  • 标签: 频繁模式 项集 挖掘算法 数据挖掘 关联规则挖掘 事务
  • 简介:如果没有漫画的话,我也许会是个画家。如果没有漫画的话,我也许会是个音乐家。如果没有漫画的话,我也许会是个医术精湛的医生……但不幸的是,逸菲既不是画家也不是音乐家、更不是医生,只是一个热爱漫画的狂热发烧友。

  • 标签: 漫画 故事连环画 《龙珠》 《城市猎人》 日本
  • 简介:随着网络技术的发展,虚拟局域网(VLAN)在网络中的应用越来越广。为了更加有效的对VLAN进行管理,本文提出了一种基于、VLAN的网络拓扑发现算法,该算法基于生成协议,通过获取每VLAN中的生成信息.来推导出每VLAN的网络拓扑结构,从而达到管理的目的。

  • 标签: 虚拟局域网 生成树协议
  • 简介:文章总结了雷达探测的目标类型,给出了各种类型目标的基本特性,确定了雷达目标识别的需求,回顾了用于目标识别的一些主要技术及其实现原理,同时比较了各种技术的优劣。最后文章给出了提高雷达目标识别性能的建议:识别参量优化技术、高分辨技术以及引入现代信号处理、模式识别及人工智能等技术。

  • 标签: 雷达 目标识别 模式识别 高分辨
  • 简介:企业数据的与日剧增,如何有效的整合企业数据,如何实现准确并且高效的分析,是数据仓库在企业管理应用中面临的重要问题。本文基于联机在线分析(On-LineAnalyticalProcessing,OLAP)技术,该技术是基于数据立方体,从不同维度对企业的数据进行分析,企业管理人员可以全面的了解企业数据信息,从而提高企业的决策管理效率。

  • 标签: OLAP 数据立方体 决策管理
  • 简介:利用社交媒体平台的带时间的签到数据和少量带标注的样本,通过快捷有效的算法对未标记地点进行智能标记。算法首先对签到数据的用户特征和时间特征进行有效抓取,并通过信息熵对数据进行验证和筛选,然后利用杰卡德相似系数对地点之间的相似性关系进行概括,接着使用松弛标记法对地点的标签概率进行计算,最后构造支持向量机分类器,利用带标注的样本对分类器进行训练,从而导入未标记数据进行标记。

  • 标签: 标签分类算法 信息熵 松弛标记法 支持向量机
  • 简介:用过MicrosoftOfficeExcel的人都知道,数据透视表是一种交互式报表。可以快速分类汇总比较大量的数据,并可以随时选择其中页、行和列中的不同元素。以达到快速查看源数据的不同统计结果,同时还可以随意显示和打印出你所感兴趣区域的明细数据。在刚刚发布的永中集成Office2007中,也新增了数据透视表功能。

  • 标签: 数据透视表 分类统计 MICROSOFT OFFICE Excel 感兴趣区域
  • 简介:<正>分类信息是一种全新的信息传播途径.它聚合了海量个人信息和商家信息,为网民解决日常生活中的焦点、难点问题提供了又一途径。分类信息网站主要由发布信息.查找信息、信息反馈等几个重要的功能组成.网民可以在这个平台上自由发布自己的需求,也可以将自己在生活中遇到的困难发布在网上寻求帮助。

  • 标签: 信息网站 网站管理 分类信息 信息反馈 信息分类 后台管理
  • 简介:频繁模式的挖掘是数据挖掘领域中一个非常重要的问题,目前在高效、可扩展的频繁模式挖掘算法方面有大量研究。已有频繁模式挖掘算法大致分为两类:基于候选生成一测试策略的Apriori算法以及基于分而治之策略的频繁模式增长算法。已有的工作大多都假设待挖掘的数据是不变的。实际

  • 标签: 频繁模式树 挖掘算法 分而治之 可扩展 APRIORI算法 数据挖掘
  • 简介:互联网的快速发展,使得目前各个软件面临较大的风险。软件的普遍适用性使得它与国民经济的增长息息相关,所以能准确的量化评估漏洞的安全性就显得至关重要。正是因为国防信息安全保障体系建设的现实需要以及应用软件安全性问题频发的现状,软件安全漏洞相关的研究已成为未来信息安全研究领域的热门课题。本文从软件漏洞的基本特征和分类入手,对软件漏洞的评估方法展开了简要的论述。

  • 标签: 软件漏洞 评估方法 信息技术
  • 简介:[Q001]游戏和游戏硬件是如何分类的?如果按照传统的游戏分类方法,游戏可以分成ACT(动作类游戏).RPG(角色扮演类游戏)、AVG(冒险类游戏).SLG(策略战棋游戏)、RAC(赛车类游戏)、RTS(即时战略类游戏).STG(射击类游戏).FLY(模拟飞行类游戏)、SPG(运动类游戏)等等。这种标准实际上是以游戏的内容来进行分类的。

  • 标签: 游戏硬件 分类方法 技术分析 角色扮演类游戏 动作类游戏 冒险类游戏
  • 简介:构件的合理分类是实现构件高效检索的基础和关键。针对目前应用广泛的刻面分类方法存在主观性因素的弊端,采用刻面分类和全文检索相结合的方法来描述构件。在此构件描述的基础上,利用聚类分析技术和语义分析技术提出一种基于语义的构件聚类索引。并通过实验验证,该聚类索引是可行的,有效地克服刻面分类方法的缺点,在一定程度上实现对构件的语义检索,而且具有较高的构件查全率和查准率。此外,用户在描述检索条件时,不再局限于限定的术语,更方便于普通用户。

  • 标签: 构件 刻面分类 聚类分析 语义分析 索引树