简介:摘要随着社会经济文化的空前发展和交际生活的日益广泛,尤其是近年来网络的迅速发展,汉语词汇灵敏地反映记录着中国当代的社会生活,尤其是近十年来,政治、经济、教育、科技、文化迅速发展,各种媒体资源不断更新并推广,文化形态日益丰富,代表新概念、引领新时尚、概括新事物的新词语层出不穷,其覆盖面和影响力愈来愈大,国家也日益重视记录、监控和研究新词语,网络流行语的广泛使用已经成为日常生活交际中的一种时尚和潮流,特别是在微信、微博这种社交媒体上,出现的频率更高。最近,“狗带”经常出现,受到广泛流传,成为网络流行语的一大热点。网络流行语既是一种语言现象,又是一种社会现象,能够直接敏锐的反映人们的社会生活和价值观念。为此,有必要对网络流行语进行研究。
简介:汉语分词是中文信息处理的一项基础性工作。为避免人工阅读或机器处理时的分词歧义和未登录词难以识别的问题,有专家建议写作时在汉语词之间添加空格。文章从语言学本体研究、语言使用以及语言工程等不同角度对传统观念下的汉语分词存在的困难进行探讨,指出汉语分词在词的定义、群众语感以及分词规范、词表确定及工程应用等方面都存在不确定及不一致等因素。近年汉语自动分词处理不纠缠于词的确切定义,以字组词,针对标注语料和网络上带有丰富结构信息的海量文本,利用机器学习方法对汉语“切分单位”的标注取得了较好的进展。针对基础性的汉语分词规范,从语言规划的政策性、科学性及引导性角度提出建议,最后指出结合语言学指导和数据驱动的机器学习策略,可望为实现汉语自动分词的准确性和适应性提升服务。