学科分类
/ 1
2 个结果
  • 简介:传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步法方法,将生物医学命名实体识别问题转化为PU场景下的命名实体识别问题。在第一步中分别使用1-DNF、Spy、NB和Rocchio算法在未标注数据中抽取强负例,然后在已有的正例数据和强负例数据的基础上构建隐马尔可夫模型,最后对待分类数据进行命名实体识别。在GENIA语料库上的实验结果显示,在标注数据较少的情况下,通过使用PU学习方法的两步法构建分类模型,其性能显著优于直接使用标注数据构建的分类模型,同时降低了人工标注数据的成本。

  • 标签: 正例未标注学习 隐马尔科夫模型 命名实体识别 文本挖掘
  • 简介:如果说2001年闪存盘市场刚开始形成的话,那么2002年绝对是闪存盘高速发展的一年。市场格局基本上已经形成,价格也在不断跳水,100元以下产品的容量已经从16MB提升到52MB,同时市场上闪盘的功能已经从单纯的存储向多元化发展(如MP5播放器),传输界面也逐渐从USB1.1提升到USB2.0。闪盘的技术含量不高,许多厂商能很快地切入市场,也正因为这个原因,市场上接近100个品牌的闪盘今消费者眼花缭乱,除了朗科、鲁文、爱国者这些一线厂商外,充斥在市场上的二线甚至是杂牌闪盘给用户带来了不少的迷惑。因此,我们有必要从闪盘的工作结构和工作原理入手,明晰了闪盘的组成原理后,再根据自己的需要选择额外的功能和外观,这样必定能选择到适合自己的产品。

  • 标签: 闪盘 分类 选购技巧 USB控制芯片 功能