学科分类
/ 25
500 个结果
  • 简介:针对网络学习者及其对案例访问的模糊性提出采用模糊的方法对学习者和案例进行聚类分析。在算法中,以各学习者对案例的访问次数、时间、学习效率等刻画学习者对案例的关注程度建立模糊相似矩阵,再由平方法求出模糊等价矩阵,然后进行聚类分析。通过具体实例阐述算法的计算过程,证明算法实现的可行性和有效性。

  • 标签: WEB日志挖掘 模糊聚类 模糊集 模糊等价矩阵
  • 简介:搜索在计算机上是多种操作的基本运算,其主要目的是从大量数据当中找出所想要的部分,而一般数据的存放,常设有键值(Key)以利搜索,例如在数据库中,要取得数据一定要配合许多键值的使用,方能有效而快速地存取。

  • 标签: 搜索方法 聚类技术 计算机 数据库 键值 存取
  • 简介:摘要本文分析了汽车行业基于不同思想的各类大数据算法,用户应该根据实际应用中的具体问题具体分析,选择恰当的算法。算法具有非常广泛的应用,改进算法或者开发新的算法是一件非常有意义工作,相信在不久的将来,算法将随着新技术的出现和应用的需求而在汽车行业得到蓬勃的发展。

  • 标签: 汽车 大数据 聚类算法 划分
  • 简介:摘要双(Biclustering)算法在数据挖掘中是一个新兴的算法,对于矩阵类型的数据,其效果很好。本文浅述了双算法的基本特点,并提出了用迭代的双算法对未知的数据进行分类,并对一组数据进行了测试,其分类表现不错。

  • 标签: 双聚类 数据挖掘 迭代 分类
  • 简介: 首先比较了数据流聚类分析与传统的聚类分析方法的一些不同点,对目前最新的一些数据流研究成果进行了分析,最后对数据流发展方向进行了展望。

  • 标签: 数据流模型 聚类分析 数据流聚类
  • 简介:聚类分析在数据挖掘领域中占有重要地位,到目前为止学者们提出了许多的算法.本文提出了一种基于kNN的算法k-NearestNeighborCluster(kNNC).该算法首先找到每个数据点的k个邻居点,然后设置匹配点数n,通过使用每个点的邻居点进行匹配进而达到效果.本文通过三个实验去验证该算法,并且与k-means算法进行比较.实验结果表明,该算法具有稳定的正确率,而其最大的优点是不需要预先设定聚簇数,它可以大致的找到的簇数.

  • 标签: KNN算法 K-MEANS算法 聚类分析 微博文本聚类
  • 简介:随着网络通信技术和无线传感硬件设备的不断发展,数据流已成为一种新的数据处理模式。文中比较了数据流方法与传统的聚类分析方法的不同、介绍了数据流模型特点、数据流算法特点、生成概要数据结构的常用方法,同时详细阐述了在扩展传统算法的基础上研究数据流方法的发展,从而为以后进一步的流聚类分析研究奠定了基础。

  • 标签: 数据流 数据流处理模型 数据流聚类算法
  • 简介:论文在分析推荐输入瓶颈问题的基础上,借助社区思想实现了显式评分输入的用户,解决了评分矩阵稀疏的问题;借助用户兴趣度的定义,实现了隐式浏览输入的用户,解决了用户兴趣度不易获取的问题.论文的研究立足于推荐系统的输入,通过聚类分析,为推荐算法的研究奠定了理论基础.

  • 标签: 推荐系统 显式评分输入 隐式浏览输入 用户兴趣度 稀疏矩阵 聚类分析
  • 简介:摘要本文在将数值型数据标准化的基础上,将分类数据细分为二元数据和类型数据,并用相异度系数距离计算分类数据之间的距离,并且赋予二元和类型数据相应的权重,来改进k-prototypes算法,使该算法满足不同要求的混合属性数据,最后通过C#语言,在ArcEngine2010版本上实现。

  • 标签: K-prototypes算法 混合属性 类型数据 相异度系数 加权属性
  • 简介:是数据挖掘中重要组成部分,为了提高的处理效率,将并行处理技术运用于k-means和PAM算法中,对k-means与PAM算法进行了改进。实验结果表明:并行k-means算法相对串行k-means算法有更好的执行效率;且k-means算法有比PAM算法更好的并行性和可扩展性。最后,该文提出和介绍了将并行技术引入谱算法。

  • 标签: 聚类算法 并行 K-MEANS PAM
  • 简介:烃化防老剂是新开发的耐抽提、抗老化性能好,且永不变色,是目前浅色橡胶制品首选的防老剂品种,另外也是天然和聚氯丁二烯橡胶最佳防老剂。烃化酚化学名称为:对甲酚和双环戊二烯丁基化反应产物,烃化酚合成主要分为两步,先由对甲酚和双环戊二烯进行缩聚,然后在异丁烯存在下进行烃基化。

  • 标签: 防老剂 酚类 烃化 双环戊二烯 抗老化性能 丁二烯橡胶
  • 简介:文本技术作为处理和组织大量文本数据的一项重要技术,能够在很大程度上解决由于信息爆炸所带来的问题。Sollin算法是构建最小生成树的典型算法,与Kruskal算法和Prim算法相比,具有容易实现并行运算的特点。因此,利用基于Sollin的快速层次算法在复旦语料和搜狗语料上进行实验,结果表明基于Sollin的快速层次算法在运行效率和质量上都优于传统层次算法。

  • 标签: 层次聚类 Sollin算法 运行效率 聚类质量
  • 简介:分析了异常入侵检测存在的问题,研究了基于模糊的入侵检测算法.该算法采用C-均值算法,通过训练数据、异常划分和行为判定等3个步骤实现异常入侵检测.试验采用KDD99数据进行了测试,证明该算法是可行和有效的.

  • 标签: 入侵检测 模糊聚类 数据挖掘 C-均值算法
  • 简介:聚类分析是数理统计中研究“物以类聚”的一种方法。近十几年,随着数理统计的多元分析方法的迅速发展,多元分析的技术便被引进到分类学中来,并形成聚类分析这个新的分支。聚类分析目前已广泛应用于自然科学研究领域,比如考古、地质、化学、生物等等。实际上,对经济管理、社会统计等部门的社会经济问题,也都可以应用聚类分析的方法来进行研究。

  • 标签: 经济区域 聚类划分 应用 聚类分析 社会经济问题 数理统计
  • 简介:对于一变量非线性相关的面板数据,现有的基于线性算法的面板数据方法并不能准确地度量样本间的相似性,且结果的可解释性低。综合考虑变量非线性相关问题及结果可解释性问题,提出一种非线性面板数据的方法,通过非线性核主成分算法实现对样本相似性的测度,并基于混合高斯模型进行样本概率,实证表明该方法的有效性及其对结果的可解释性有所提高。

  • 标签: 非线性 面板数据聚类 核主成分算法 混合高斯模型
  • 简介:摘要技术作为当前应用最广泛的静态数据分析技术之一,在多个领域发挥着重要作用,特别是在金融投资方面。俗话说物以类聚、人以群分,就是相似的元素,就是把相似的元素聚在一起,相当于一个集合。聚类分析技术就是研究分类问题的一种统计分析方法。在进行金融数据分析时,我们经常会使用到技术,并且分析结果意义重大,例如对股票的涨势、收益进行分析,能够为投资者提供投资范围和价值,帮助投资者把握股票的整体特点,为投资者的投资决策提供依据。本文主要讨论在是技术在金融数据分析中的应用。

  • 标签: 聚类技术 金融 数据分析
  • 简介:借助K-means算法等数据挖掘技术,从我国博士研究生招生实际状况入手,从博士招生的结构质量、生源质量和选拔质量等角度分析研究生招生质量,提出科学合理的优化选拔方式、提升生源质量的博士生招生方案,对博士研究生招生单位具有良好的借鉴意义。

  • 标签: 博士 招生 质量 聚类技术
  • 简介:本文针对目前基于算法的入侵检测技术存在符号类型数据处理能力欠缺、误报率较高的问题。提出了一种基于和关联规则修正的入侵检测技术。该方法将关联规则挖掘技术引入到聚类分析机制中.利用针对符号型属性的关联规则挖掘结果对结果进行修正,从而有效降低由于在入侵检测单纯使用聚类分析所导致的误报。文中详细的阐述了改进的具体实现方案,并通过实验验证了该技术的可行性。

  • 标签: 入侵检测 模糊聚类 关联规则