学科分类
/ 1
5 个结果
  • 简介:随着知识经济的快速发展,对专利文本的分析与研究可以帮助人们了解新技术,推测技术的发展方向。自动关键词抽取在中文专利文本的分析与研究中有着至关重要的意义。介绍一些目前已有的自动关键词抽取技术成果,包括有监督方法和无监督方法,并对关键词抽取的评价指标做简单的介绍。

  • 标签: 专利文本 关键词抽取 有监督方法 无监督方法 评价指标
  • 简介:提出一种改进TF-IDF结合余弦定理计算中文语句相似度方法。首先采用IKAnalyzer分词器对中文语句分词处理,提取核心关键词,然后通过计算句子关键词词频和权重形成的TF-IDF向量组,结合余弦定理实现中文句子相似度计算。改进后的TF-IDF计算方法采用《同义词词林》词典实现对关键词及其同义词词频统计,并通过Lucene技术实现关键词权重快速计算。改进后的中文句子相似度算法不仅考虑句子中关键词的物理特征,还对关键词的语义特征进行相似度计算,提高中文句子相似度计算的准确性。

  • 标签: TF-IDF 余弦定理 同义词词林 LUCENE
  • 简介:富士施乐(中国)有限公司正式成为中国印刷标准化技术委员会观察成员单位,这是首次由数字印刷设备厂商担任观察员。富士施乐的加入,是全国印刷标准化技术委员会落实《深化标准化工作改革方案》的体现,以及在新形势下积极推进标准化工作对外开放进程的举措,更是标委会对富士施乐在数字印刷领域的影响力以及长期推动印刷标准化普

  • 标签: 全国印刷 印刷标准化 委员会观察
  • 简介:虽然我国一直在减少煤炭在能源消费结构中的比例,但是2015年中国的煤炭消费量仍占世界的一半。2015年,世界煤炭产量约80亿吨,中国产量达37.5亿吨,虽然同比减少3.3%,但仍占世界的47%;中国煤炭消费量为39.65亿吨,同比下降3.7%,但仍占世界煤炭消费量的一半。煤炭在中国能源消费结构的比重达到64%,远高于30%的世界煤炭平均水平。

  • 标签: 煤炭产量 消费量 世界 能源消费结构 中国