简介:基于多类别肿瘤基因表达谱数据集,从研究肿瘤与正常组织的分类入手,对肿瘤分类特征基因选取问题进行分析和研究。将决策树算法应用到肿瘤基因表达谱分类研究中,尝试引入遗传算法,对决策树分类规则进行优化。试验结果表明,在样本有限的情况下,该方法比单个决策树具有更高的分类精度。
简介:通过扩充情感词典词基数,新建中立词词典,引入网络流行词等方式丰富情感词典,提高分词后情感词匹配的准确性;以某评价类网站网民评论作为原始数据进行分词,提取相应的正向情感分数,负向情感分数,中立情感词个数,评论情感总分值等特征,通过对连续数据的规约提炼离散属性,按照信息增益最大原则生成决策树进行评论的情感分类,去除小概率节点后进行两次实验,对好评的识别率达到90%,对差评的识别率达到92%。对中评的识别率达到75%。
简介:该文在描述决策树分类算法的基础上,叙述了决策树分类算法用于网络入侵检测领域,给出了决策树分类模型的构造过程,并说明了应用基于决策树模型检测入侵的过程。最后用KDDCUP99数据进行实验,验证了用本文描述的方法检测入侵行为的有效性。
简介:该文首先对决策树技术相关理论和SQLServer2008BI平台作了介绍,然后对用于挖掘分析的数据源进行了预处理。利用SQLServer2008BI平台下的决策树分类技术和DMX语言即数据挖掘扩展语言创建了课程成绩分析决策树模型。挖掘提升图和分类矩阵对该模型的评估结果表明模型具有较高的可靠性和分类准确度,同时模型对应的一些规则和模式可作为课程教学管理及改革的重要参考依据。
简介:
简介:数据结构设计的重要目标之一是提高操作速度,特别是检索速度。局部平衡的红黑树、平衡的AVL树等二叉搜索树具有良好的检索性能,非常适合于基于内存的索引,但为防止树形结构退化为线性结构,在插入和删除结点时经常需要旋转,维护数据结构的操作比较复杂。文章阐述伸展树在检索过程中通过自动调整结构,使访问最频繁的结点靠近树结构的根,从而减少访问代价,指出伸展树可以作为各种线性序列的索引组织方法,能在一些需要高效索引的大工程中加以运用。
简介:根据杀毒软件公司的统计,目前全球有25万多种病毒,如果按照基本类型划分,可归结为6种类型。
简介:在数据集中挖掘频繁模式是数据挖掘研究的关键环节之一。在过去,很多的努力都集中在独立数据的挖掘上。然而,现实世界中许多实体之间总会保持着千丝万缕的关系。如何获得这些关系的频繁模式,已逐渐成为近年来研究的一个目标,我们将它称之为频繁结构的挖掘。在数据挖掘中,一个重要的方法是关联规则挖掘。它被用来发现频繁出现在数据库事务中的项集;另一个重要的方法是序列挖掘,它的任务是去寻找一个项集的序列。这些挖掘任务都被称为频繁模式的挖掘。
简介:如果没有漫画的话,我也许会是个画家。如果没有漫画的话,我也许会是个音乐家。如果没有漫画的话,我也许会是个医术精湛的医生……但不幸的是,逸菲既不是画家也不是音乐家、更不是医生,只是一个热爱漫画的狂热发烧友。
简介:随着网络技术的发展,虚拟局域网(VLAN)在网络中的应用越来越广。为了更加有效的对VLAN进行管理,本文提出了一种基于、VLAN的网络拓扑发现算法,该算法基于生成树协议,通过获取每VLAN中的生成树信息.来推导出每VLAN的网络拓扑结构,从而达到管理的目的。
简介:文章总结了雷达探测的目标类型,给出了各种类型目标的基本特性,确定了雷达目标识别的需求,回顾了用于目标识别的一些主要技术及其实现原理,同时比较了各种技术的优劣。最后文章给出了提高雷达目标识别性能的建议:识别参量优化技术、高分辨技术以及引入现代信号处理、模式识别及人工智能等技术。
简介:企业数据的与日剧增,如何有效的整合企业数据,如何实现准确并且高效的分析,是数据仓库在企业管理应用中面临的重要问题。本文基于联机在线分析(On-LineAnalyticalProcessing,OLAP)技术,该技术是基于数据立方体,从不同维度对企业的数据进行分析,企业管理人员可以全面的了解企业数据信息,从而提高企业的决策管理效率。
简介:描述了查询树的启发式优化方法,优化了文献[1]中的查询树,并分析了查询树的执行代价。
简介:利用社交媒体平台的带时间的签到数据和少量带标注的样本,通过快捷有效的算法对未标记地点进行智能标记。算法首先对签到数据的用户特征和时间特征进行有效抓取,并通过信息熵对数据进行验证和筛选,然后利用杰卡德相似系数对地点之间的相似性关系进行概括,接着使用松弛标记法对地点的标签概率进行计算,最后构造支持向量机分类器,利用带标注的样本对分类器进行训练,从而导入未标记数据进行标记。
简介:用过MicrosoftOfficeExcel的人都知道,数据透视表是一种交互式报表。可以快速分类汇总比较大量的数据,并可以随时选择其中页、行和列中的不同元素。以达到快速查看源数据的不同统计结果,同时还可以随意显示和打印出你所感兴趣区域的明细数据。在刚刚发布的永中集成Office2007中,也新增了数据透视表功能。
简介:<正>分类信息是一种全新的信息传播途径.它聚合了海量个人信息和商家信息,为网民解决日常生活中的焦点、难点问题提供了又一途径。分类信息网站主要由发布信息.查找信息、信息反馈等几个重要的功能组成.网民可以在这个平台上自由发布自己的需求,也可以将自己在生活中遇到的困难发布在网上寻求帮助。
简介:频繁模式的挖掘是数据挖掘领域中一个非常重要的问题,目前在高效、可扩展的频繁模式挖掘算法方面有大量研究。已有频繁模式挖掘算法大致分为两类:基于候选生成一测试策略的Apriori算法以及基于分而治之策略的频繁模式增长算法。已有的工作大多都假设待挖掘的数据是不变的。实际
简介:互联网的快速发展,使得目前各个软件面临较大的风险。软件的普遍适用性使得它与国民经济的增长息息相关,所以能准确的量化评估漏洞的安全性就显得至关重要。正是因为国防信息安全保障体系建设的现实需要以及应用软件安全性问题频发的现状,软件安全漏洞相关的研究已成为未来信息安全研究领域的热门课题。本文从软件漏洞的基本特征和分类入手,对软件漏洞的评估方法展开了简要的论述。
简介:[Q001]游戏和游戏硬件是如何分类的?如果按照传统的游戏分类方法,游戏可以分成ACT(动作类游戏).RPG(角色扮演类游戏)、AVG(冒险类游戏).SLG(策略战棋游戏)、RAC(赛车类游戏)、RTS(即时战略类游戏).STG(射击类游戏).FLY(模拟飞行类游戏)、SPG(运动类游戏)等等。这种标准实际上是以游戏的内容来进行分类的。
简介:构件的合理分类是实现构件高效检索的基础和关键。针对目前应用广泛的刻面分类方法存在主观性因素的弊端,采用刻面分类和全文检索相结合的方法来描述构件。在此构件描述的基础上,利用聚类分析技术和语义分析技术提出一种基于语义的构件聚类索引树。并通过实验验证,该聚类索引树是可行的,有效地克服刻面分类方法的缺点,在一定程度上实现对构件的语义检索,而且具有较高的构件查全率和查准率。此外,用户在描述检索条件时,不再局限于限定的术语,更方便于普通用户。
基于遗传算法优化决策树的肿瘤基因分类研究
基于决策树的网民评价情感分析
决策树在网络入侵检测中的研究与应用
基于决策树技术和SQL Server BI平台的课程成绩分析
树中观潮
“伸展树——一种高效的索引树”教学设计
病毒的分类
Chopper:有效的树挖掘算法
闲话日本漫画的分类
基于生成树协议的VLAN管理
雷达目标的分类识别技术
OLAP多维数据分析在企业决策管理中的应用
查询树的启发式优化研究
社交地点分类算法设计与实现
分类统计让数据透视表来帮忙
圈地为王 分类信息网站建置
基于频繁模式树的频繁模式高效增量维护
软件漏洞的特征、分类与评估方法研究
关于游戏硬件的大百科——游戏硬件100Q 游戏分类与技术分析
一种改进的构件聚类索引树的研究