学科分类
/ 1
2 个结果
  • 简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉隐含信息或趋势。其中,词频统计帮助我们获取分析对象词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确判断。词表比对揭示了对象文本叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中高频人物、组织等,并揭示这些热词之间潜在联系,从而快速构建热点事件基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切共现词,从而有效捕捉与之相关热点话题和媒体动向。

  • 标签: 数据挖掘 词频统计 词语共现网络 MI-score 语料库语言学
  • 简介:处所「デ」格句首分布表示事件发生处所,句中宾语前分布表示动作进行处所,句中宾语后分布凸显处所焦点。三者可共现于同一句中,其语义范围为:句首分布>句中宾语前分布>句中宾语后分布,符合时间范围原则,受包容原则支配。处所「デ」格语义有多种指向,受客观现实、句法位置、谓语语义特征等因素制约。其中,客观现实是最优先制约因素,在其允许实现前提下,处所「デ」格句法位置与谓语语义特征也是重要影响因素。

  • 标签: 句法位置 语义特征 语义指向 时间范围原则 包容原则