字母词的全/半角形式对中文分词的影响及对策初探

在线阅读 下载PDF 导出详情
摘要 中文科技名词自动抽取的关键步骤是分词,文章首先讨论中文语料库中字母词的全/半角现象,然后考察这种现象对自动分词结果当中字母词的一致性和准确性所产生的影响,并给出提高切分结果的一致性和准确性的对策,最后阐述中国传媒大学的分词系统在这方面所做的工作。
机构地区 不详
出处 《中国科技术语》 2010年4期
出版日期 2010年04月14日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献