学科分类
/ 2
25 个结果
  • 简介:随着信息化浪潮席卷全球,手工分类索引已经不适用于大规模信息的处理了,自动分类的研究随着时代的需要蓬勃发展了起来。本文首先介绍了自动分类技术的背景和历史发展,然后着重介绍了目前应用最广泛的几种自动分类方法;其后,结合实际研究课题介绍了基于仿人思想的自动分类方法,并对自动分类技术未来发展的方向作了展望。

  • 标签: 自动分类 信息检索
  • 简介:随着科学技术日新月异地高速发展,反映科学技术发展的文献量在呈爆炸式增长,旧的文献加工处理模式已不能适应这一新的形势。这就迫切要求文献信息部门建立一种新的文献加工处理模式,而计算机在各个领域的广泛应用为我们创造了条件,使图书情报事业得到了飞跃发展,图书馆业务工作中很多过去由手工来完成的工作已由计算机逐

  • 标签: 自动化系统 著者号码表 同类书 计算机 文献加工 处理模式
  • 简介:目前大多数自动标引方法不能有效利用文本中包含的多个特征。而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取。同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量。为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引。实验结果表明,基于集成学习方法的自动标引能提高标引结果的查准率和召回率。另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果。

  • 标签: 自动标引 关键词提取 集成学习
  • 简介:简述了开展图书馆自动化建设评估的重要性,并就评估的目的、内容、指标体系及组织领导等几个主要问题进行了初步探讨。

  • 标签: 图书馆 自动化建设 重要性 指标体系
  • 简介:黄页分类工作是电话号码簿编辑的主要工作之一。黄页公司一直致力于探索运用计算机技术对黄页数据分类进行自动标引。1998年开始进行人机对话的计算机自动切分工作,现切分结果的正确率达到了60%以上,标引速度达到了每小时1200条。

  • 标签: 黄页分类 电话号码簿 自动标引 计算机
  • 简介:题目学科分类对海量题库的汇聚和应用有着重要意义。本文提出的二次分类方法能有效提高分类正确率,尤其针对那些容易混淆的学科,经过进一步的优化处理,取得比较显著改进效果。

  • 标签: 题库 卡方检验 朴素贝叶斯分类 支持向量机
  • 简介:本文叙述了目前人们可以通过网络数据库实现全文检索的情况下,自动标引的重要性,它可以针对海量信息进行检索和挖掘,可以把人类的思维同计算机技术相结合,使检索信息更完整、全面。

  • 标签: 中文数据库 索引 自动标引
  • 简介:中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。作者比较了两种分类主题词表的编制模式,讨论了机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。文章最后还分析了将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。

  • 标签: 中国分类主题词表 中国图书馆分类法 分类主题词表 计算机辅助编制 知识库 自动分类
  • 简介:从信息服务时效性的跨度和储存媒体的型态出发.阐述了图书馆信息服务的三种形式及其特点,以及图书馆自动化在三种形式中的定位,同时提出了现阶段图书馆信息服务对自动化的基本要求。

  • 标签: 图书馆信息服务 图书馆自动化 时效性 型态 媒体 形式
  • 简介:图书馆期刊部是从期刊与图书混合管理发展到单独管理而产生的管理机构。它集期刊采、编、藏、用于一体的单独管理模式,符合期刊管理的基本规律,充分发挥了期刊管理的各项职能,既有历史价值,又有现实意义。由于计算机技术引入图书馆的日常管理和服务工作,因此改变了管理与服务手段。随着读者对文献需求的不断变化,以及日常管理系统的不断更新,使期刊部工作日益规范化,并且增强了期刊工作的活力。一、自动化管理系统带动期刊部工作发展计算机技术对图书馆业务实施自动化管更多还原

  • 标签: 图书馆 自动化管理 期刊管理系统 期刊工作 期刊工作人员
  • 简介:古代农业专题资料自动编纂是利用计算机自动从古代农业专题资料中发现并摘录与某一主题相关的农业资料,并编纂成册。本文首先阐述了古代农业专题资料自动编纂的意义,接着比较了它和自动文摘的关系,然后就其自动编纂的流程和算法进行了设计,最后总结本文的写作目的。

  • 标签: 古代农业专题资料 自动编纂 自动文摘 自动分词 篇章分割
  • 简介:随着我国改革开放的深入和WTO的加入,迅速提高我国国民素质和教育水平就成为我们的一个重要任务。建设一个现代化的高等教育体系,首先需要建设一批有着先进教学和管理理念以及完善的教学基础设施的高等院校,而高校图书馆作为高校的三大支柱之一,已经成为了衡量和评价一个高校是否先进的标志。特别是在21世纪,知识与信息的传播速度越来越快,数字化信息大量普及,高校图书馆在信息资源与读者之间扮演的角色也越来越重要。它将

  • 标签: 高校图书馆 图书馆自动化 网络系统 设计 主机系统 存储方式
  • 简介:图书馆自动化集成管理系统已成为大部分图书馆基础业务的运行平台,自动化管理系统的引进为规范化管理赠书工作提供了有利条件。针对赠书工作中存在的问题,就如何利用自动化系统的相关功能完善赠书管理工作进行了探讨。

  • 标签: 赠书 赠书管理 自动化系统 UNICORN
  • 简介:由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。

  • 标签: 《中国图书馆分类法》 分类矩阵 自动分类
  • 简介:电子政务主题词表是电子政务信息的组织和检索的重要语义工具。传统手工编制叙词表的方法耗费大量人力、物力,成本高、历时长,已不再适用于网络环境。本文拟以共青团电子政务词表为例,探讨用计算机自动构建叙词表的方法。主要技术要点包括:利用N-gram方法进行选词、结合Dice测度、相似度算法、模式匹配等多种技术来自动识别词汇的等同、等级和相关关系。最后评测了自动构建的电子政务主题词表的性能。

  • 标签: 电子政务 叙词表 词表自动构建 词间关系识别 N—gram方法
  • 简介:分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。本文详细讨论了该知识库的构建原理、结构、编制使用的关键技术以及主要应用等。

  • 标签: 《中国图书馆分类法》《中国分类主题词表》知识库 知识组织系统 自动标引 自动分类 中文文献数据库 信息自动分类
  • 简介:为了提高索引编制的效率与质量,利用计算机技术实现古籍目录索引自动编制,其重要性、必要性不言而喻。“中华古籍索引库”在古籍目录索引自动编制方面作出了有益的探索和实践。本文以“中华古籍索引库”为例,介绍索引编制过程中,索引条目抽取、编排等环节的工作思路及经验。

  • 标签: 中华古籍索引库 古籍目录索引 自动编制
  • 简介:为了使一些国家地质科技情报的服务统一在一个整体化的格局内,要求综合解决科学、方法、技术和组织等方面的问题,应在拟定解决方案时必须考虑由于国际上及建立的系统的情况而产生的诸多因素和条件。

  • 标签: 检索系统 检索语言 地质学