学科分类
/ 1
1 个结果
  • 简介:向量空间模型(VSM)是信息检索领域应用较好的模型。数据库技术是一门发展成熟、应用广泛的技术。本文提出了利用VSM模型和数据库技术相结合来计算文档相似。结合TFIDF算法思想,设计一种结合数据库进行计算权重的类TFIDF算法。在此基础上设计出了文档相似检查软件。该软件主要有文档分词、词频统计、相似计算三大模块,软件可以计算出文档和其他文档的相似

  • 标签: VSM模型 TFIDF算法 词频 相似度 数据库