学科分类
/ 1
20 个结果
  • 简介:成分指构形的词缀及虚词。成分的性质,可以从下列方面加以考察:1.组合功能,包括位置(前粘着的或石粘着的)和粘附的对象(词根、词或词缀);2.语义功能(修饰性的或结构性的)。一个方言的成分有其本身的系统性,分类时应根据以上各项全面考察,从本方言的实际出发,注意成分间区别和联系,不能简单地比照普通话而定。广州方言后置(前粘着)的成分中,有一类如“你行先”、“咪行自”中的“先”、“自”之类,其语义功能属修饰性的,与副词相类;另一类如“执”、“生得靓”中的“”、“靓”之类,其语义功能是结构性的,与介词、连词相类。前者历来多看作“后置副词”,后者多归入动词。我们认为前者宜归入助词,而后者宜从助词中分出。本文先讨论成分的分类原则和广州方言的某些特点,在此基础上提出一个成分的分类系统,将常见的成分归入系统中相应的类。

  • 标签: 虚成分 广州方言 修饰性 语义功能 粘附 结构性
  • 简介:摘要实词虚化是汉语发展中的重要现象,体现了汉语词汇、语法的重要规律。基于汉语中实词虚化的重要背景,本文着重分析“了”由最初的实词义向虚词义的过渡过程。

  • 标签: 实词虚化 本义 引申义
  • 简介:文章主要讨论疑问代词“谁”的指意义和否定意义的形成机制。文章尝试证明指用法的“谁”字句通过不确定性陈述语气,来消除疑问代词“谁”的询问意义,但是保留了它的预设意义“存在着某些个人”,从而使指用法的“谁”表示“不能确定一定存在的某些个人”。而否定用法的“谁”字句通过质疑和反驳等反问语气,在“疑有信无”原则的指导下,不仅消除了疑问代词“谁”的询问意义,而且消除了它的预设意义“存在着某些个人”,从而使否定用法的“谁”表示“确定不存在的某些个人”。最后,文章还分析了“谁让我小呢?”之类特殊句式的意义,说明它跟一般的“谁”类反问句在语义解释上具有一致性。

  • 标签: 疑问代词“谁” 询问意义 虚指意义 否定意义 疑有信无 语义解释
  • 简介:本文通过对不同字表、词表对实际阅读材料覆盖的考察,发现字、词覆盖并不能很好地反映对阅读材料的识读水平,在词覆盖的基础上提出的阅读识读可以更好地反映对阅读材料的识读水平。通过对阅读材料的考察和计算发现,满意的阅读理解建立在0.95左右的识读上。通过对不同词表所包含字数及其识读的分析和比较得出,阅读者掌握的字词比达到1:7以上才能达到这样的识读水平。学习汉语时,掌握近3千汉字的同时,应该掌握2—3万个左右的汉语词语。

  • 标签: 阅读理解 覆盖率 识读率 字词比
  • 简介:对目前音韵学中所用的统计方法进行了全面的比较,分析了统计法在音韵研究中的必要性和可行性,强调了统计法的科学性,并从统计学原理、方法的引入、运用中的注意事项和统计法在音韵学运用中的优势和不足等方面对三种统计方法进行了详细的阐述。

  • 标签: 方法论 概率论 音韵学 统计
  • 简介:中文姓名的辨识是自动分词、自动文摘的基础.独立于自动分词,我们运用姓名用字概率和规则,设计并实现了一个中文姓名辨识系统.对207757字语料进行了测试,召回达到92.57%,精确达到80.35%,且速度较快.

  • 标签: 概率分布 规则筛选 兼类姓 专有人名 特殊候选姓名对
  • 简介:语料库大规模真实语料的汉语句型自动分析与频度统计,是查清现代汉语句型现状的主要途径,也是继汉字字频统计和词频统计之后的又一重大基础性研究课题。本文主要给出以结构特征为标准的句型系统的汉语句型频度表、实验数据与分析、实验模型及其工作原理的简单介绍。

  • 标签: 汉语句型 频度统计 句型成分分析 性质形容词 单音节形容词 趋向动词
  • 简介:本文通过介绍和评论基于统计的语言处理模型的工作原理和有关的应用实例,从语言学理论的角度来说明统计模型的局限性。通过讨论N元语法模型及其在词类标注上的应用,展示基于统计的语言处理模型的工作原理及其应用。讨论了语言结构的递归性特点和语言学知识的结构依赖性特点,指出递归嵌入会使得统计规律被任意数目的嵌入词语打乱,语言学知识的结构依赖性将使得统计模型赖以实现的独立性假设失效。

  • 标签: 统计模型 有限状态语法 马尔科夫过程 递归性 结构依赖性
  • 简介:常用字字量问题是汉字规范首先要解决的问题之一。本文探讨在不同条件下确定的不同字表,是否可以用统计学的假设检验方法,对这些字表的出现概率进行比较,以字表在实际应用中概率的高低来评价其应用效果的大小。经过实际运算,得出了调整后的《规范汉字表》常用字表在应用中的概率高于原3500常用字表的结论。由此证明《规范汉字表》确定的常用字表是合理的、优化的。

  • 标签: 常用字 规范汉字表 累积频率 统计方法
  • 简介:《黄州竹楼记》中的"茶烟"一词,各家注释众说纷纭,各种辞书均未立条解释.为此,本文通过对《全唐诗》、《全宋词》的全文机器检索,发现"茶烟"共有43例之多,除不成词者外,少数是指焙茶或"烹茶炉火的烟气"、"煮茶的烟火",更多的则是指茶水热汽.

  • 标签: 茶烟 《全唐诗》 《全宋词》 全文检索 茶水热汽
  • 简介:文章采用邻接算法、主成分分析方法以及高程模拟综合图的交叉分析方法对11个闽南方言音系材料进行计算分析,可得到闽南方言区域传播的固有模式。计算结果显示闽南方言的传播模式为从东北向西南沿海岸线传播,这与人口迁移史相吻合。计算结果在音系结构相似度、语言历史、语言传播方向等方面与传统语言学研究成果可互相印证,说明通过方言音系结构之间的差异分析语言演化模式具有可行性。

  • 标签: 音系结构 P-distance模型 邻接 主成分分析 综合图
  • 简介:国外的释义性词语研究始于“基础词汇”词表的研制,最终促成使用最低限量词汇释义的词典编纂方法,而汉语词典的释义性词语计量研究迄今尚无任何进展。本专题基于现代汉语元语言系统研究的理论方法,率先对《现代汉语词典》的释义性词语进行全面性计量研究,依据统计结果划分频度相对等级,列出《XH释义性语料高频词表》。本研究重在为汉语词典编纂优选释义性词语提供基础,也可补现代汉语常用词统计的语料选取缺陷。

  • 标签: 汉语词典 释义性词语 统计 分级 高频词表
  • 简介:文章以"数理统计法"分析两汉时期各韵部的历时演变以及音变条件,检讨"鱼歌"、"侯鱼"、"支歌"、"脂微"、"东阳"、"阳耕"、"真文元"、"质物"、"祭(月去)叶"等合韵关系,此外也对上古的"重韵问题"提出看法。

  • 标签: 数理统计 上古韵 合韵 重韵 两汉诗
  • 简介:语文是一门培养、提高学生处理中文信息的技能与能力的工具性基础课程。将中文信息处理技术及方法引进到语文教学的研究及教学过程中,可以推动语文教学的现代化。本文介绍运用中文信息处理技术统计分析中小学语文课文字词分布的状况及这些统计分析对教学研究、教材编写的价值。

  • 标签: 统计分析 分布
  • 简介:两岸华语在口语语法方面的差异尚未得到学界深入的比较研究,其中指示标记的差异较为突出。台湾国语对话体里“那”比“这”大,这主要是由于对话语体的性质、新信息、话题跳跃与弱社会化程度有利于“那”出现。后置性指示标记“这样子”在台湾国语对话体里颇具特色,男女老少皆用,给人以流行、亲昵的意味。

  • 标签: “这” “那” “这样子” 两岸华语 台湾国语 普通话
  • 简介:摘要长短元音在不同语言中存在不同表现和特征,国内孟高棉语、德昂语、克木语的元音在韵尾时都存在长短对立。对长短元音进行统计研究,有助于认识长短元音本质的特征。本文的主要研究对象——那姆佤话,长短元音对立也是其语言中较明显的特性,另外,长短元音与不同声母的搭配情况与规律也展示其语言的特殊性。

  • 标签: 那姆佤话,声母,长短元音
  • 简介:形名组合指形容词直接修饰名词的定中结构。词长搭配主要指2+2、2+1、1+2、1+1这四种形式。“的”字隐现指“的”字可有可无且基本同义的情况,如“特殊(的)问题”、“正确(的)方向”等。关于形名组合出现的量化研究不多。祁峰和端木三(2015)对四种形名词长搭配进行了量化考察,但是没有考虑“的”字隐现问题,结果不够精确。文章以“兰卡斯特汉语语料库”为语料来源,通过“的”字隐现的语感实验,对“的”字隐现情况进行了明确定义。然后,排除“的”字隐现情况,重新进行了统计。研究发现,在真正无“的”的四种词长搭配中,2+1的出现(类频)不到5%,与前人看法相似,而2+2的出现不到2%,大大低于前人估计。研究表明,和2+1一样,真正无“的”的2+2形名组合在汉语中不是能产的结构,而是受限制的结构。

  • 标签: 形名组合 词长搭配 “的”字隐现 小分枝结构 韵律词 音步屏蔽
  • 简介:摘要本文主要讨论日语自动词可接ヲ格的具体情况及限制条件,收集了248个接ヲ格的自动词,试图用定量的研究方法来把这些可接ヲ格的自动词做一个定性的分析。收集的方法主要通过查阅较有说服力的字典和相关文献资料。

  • 标签:
  • 简介:本研究提出同音和同音度的概念,作为同音字特性的量的指标,并计算出汉字同音为80.49%,汉字同音度的均值为7.85,且为偏态分布.通过对汉字同音度的研究,揭示出汉字同音音节个数随同音度增加而递减的规律.对此规律的讨论引申到可能的语言发展中的"清晰原则".

  • 标签: 同音字 同音率 同音度 平均同音度