数据挖掘在高校图书馆服务中的应用探析

(整期优先)网络出版时间:2016-11-21
/ 2

数据挖掘在高校图书馆服务中的应用探析

张璐璐

安徽粮食工程职业学院安徽合肥230013

摘要:随着数据库技术在高校图书馆数据库中的广泛应用,面对数据积累越来越多以及读者不知如何从海量的图书资源中快速找到自己感兴趣的信息的问题,启发我们将数据挖掘技术运用到高校图书馆中,以实现对不同的读者提供个性化的信息推荐服务。本文对数据挖掘在高校图书馆服务中的应用进行探析。

关键词:高校图书馆;数据挖掘;聚类分析;关联性分析;个性化服务

高校图书馆服务对数据挖掘的需求

随着高校图书馆越来越多地参与到教学与科研过程中,其服务水平也需要有相应提高。当前高校图书馆追求以客户需求驱动图书馆服务,使用户的满意度提高,从而以最低成本实现对教学、科研最有效的支持。

高校图书馆通过各种途径收集用户(包括潜在用户)的相关信息,实现用户的识别。这里的潜在用户是指没有图书馆服务记录的学生。其次,图书馆根据相关信息对用户进行分类,体现用户群之间的差异。再次,图书馆对区分后的不同用户群进行分析,了解其特点和需求。最后,图书馆根据所了解的需求进行纸质和电子资源的采购,根据用户的特征提供有针对性的定制服务。采购和服务获得的信息以及最终绩效数据被记录,并在对用户进行识别、区分和特征分析的过程中使用。由此可以看出,全流程的各阶段都有大量的数据需要分析,而很多时候理想的分析结果隐藏在数据中,需要专业人员和技术来实现这一过程。但是,基于现在各高校图书馆人员的专业结构和职位分配,相当多的信息分析难以完成。因此,必须寻找一种途径便捷地实现数据的分析。

数据挖掘被称为数据库中的知识发现,它利用神经网络、模式识别、归纳逻辑的方法,从大量数据中挖掘出未知的、有价值的一些模式和规律,归纳成为知识后供使用。由此可见,数据挖掘正是高校图书馆所需要的数据分析工具。借助于这种工具,高校图书馆才有可能真正实现需求驱动服务。

二、高校图书馆应用数据挖掘技术可行性

目前,数据挖掘技术已经应用到通信、零售、金融、制造等多个领域,大量企业在其经营管理过程中使用了该技术。在这些企业的使用过程中,基本上没有出现因为技术本身缺陷造成损失的情况,因此,数据挖掘技术较为成熟,应用该技术的技术风险较小。另一方面,由于目前社会对大数据分析极为重视,所以数据挖掘的各种应用发展较快。有相当多的软件或者系统已经可以实现对大量数据的挖掘,也有一些企业提供数据挖掘的相关服务。高校图书馆可以根据自身情况,选择由自己完成或者外包数据挖掘工作。因此,高校图书馆获得数据挖掘技术并不困难。

三、数据挖掘在高校图书馆中的应用

1、图书文献推荐工作中的应用

利用数据挖掘技术对读者的历史借阅数据进行聚类分析或者关联分析,可以发现读者所借阅的图书文献之间存在一定的关联规则,即读者在借阅一类图书的同时也会借阅其他相关类别的图书,通过计算这种关联规则的支持度和置信度,得到读者的借阅模式,建立图书推荐数据库,在读者发生借阅行为时通过分析比较为读者推荐相关有价值的图书文献资源。例如,通过关联分析发现大多数读者在借阅了计算机编程语言教程图书的同时又借阅了数据库方面的书籍,说明这两类图书之间有较强的关联,那么在其他读者借阅前一类图书时可以为读者推荐后一类图书的相关资料。这样就可以帮助读者更好地学习,同时节省读者的大量查找时间,从而提高图书馆服务的质量。

2、文献检索中的应用

文献检索是反映高校图书馆个性化信息推荐服务的重要方面。传统的文献检索功能只能为读者提供简单的文献信息,而不能根据读者的阅读兴趣爱好提供个性化推荐服务。利用数据挖掘技术可轻松实现为读者提供个性化推荐服务的目的。首先,准备所需要的数据。收集有关读者借阅行为的大量数据信息,包括图书馆系统数据库中的读者借阅记录、预约信息和续借信息等。其次,数据的筛选和处理。对所收集的数据进行消除噪声数据、重复数据等筛选操作,再对筛选后的数据进行预处理和转换等,建立结构化数据库,这样有利于数据挖掘算法的运行。再次,挖掘数据。对先前建立的数据库进行聚类分析和关联分析,从中可以分析出不同类型读者所借书目的集合、阅读兴趣爱好特征等信息。最后,利用数据挖掘的结果结合可视化技术为读者提供个性化的文献检索服务。当读者检索文献时,通过数据挖掘形成的推荐集,检索结果会自动为读者推荐与这些文献相关的其他文献,并自动提取呈现有价值的相关文献的数据信息,并且将这些数据信息以可视化的、动态改变的方式呈现在读者面前。

3、优化馆藏书架管理

由于图书馆馆藏种类繁多,因此优化馆藏书架管理工作就成了影响高校图书馆科学发展的一个重要内容,而优化馆藏书架管理工作的一个方向就是预测图书文献的变化趋势,做到为最新的文献在书架中预留位置,减少图书馆藏图书倒架次数,还要及时做好剔除旧文献添加最新文献的工作。利用数据挖掘技术就可以实现上文所述的工作内容。首先利用预测分析技术中的回归与时序分析方法对历年的图书文献借阅日志进行分析,找出文献被借阅的周期性变化,然后分类分析图书馆借阅图书流通日志,可以发现借阅频繁的图书类别和增加幅度比较大的图书类别。将两部分分析的结果相结合,根据排架规则,在上架那些借阅量大且频繁的图书时尽可能地预留位置,减少图书馆藏图书倒架次数。最后就是剔除旧文献添加最新文献的工作。对馆藏中的文献数据进行分类分析,根据规定时间内未流通的图书和有过多的复本图书等分类要求,统计出符合这些规定的文献的数量和藏书位置,将其及时下架。

4、情报咨询工作中的应用

互联网所包含的信息浩如烟海,想要及时有效地获取所需的知识信息是一个很大的难题,同时也是衡量情报咨询工作的一个标准。利用Web挖掘技术就可以比较容易地解决上述难题。首先,准备一台与互联网相连接的Web挖掘服务器,根据学校的教学安排、科学研究以及学校未来发展方向等各方面的需要,利用Web挖掘技术在服务器上对互联网上网页进行挖掘。Web挖掘可根据用户所提出的需求自动地从互联网上搜索相关网页,对这些海量数据信息进行深层次地分析,并能够保证数据的完整性和安全性。其次,通过对检索所得结果进行聚类分析和分类分析,将从互联网上检索到的相关数据信息按照学科建设和科研方向等进行分类分析,然后建立摘要、索引或者其他有效链接。最后建立检索界面,通过可视化的方式服务用户。用户可以通过代理服务器根据关键词、主题词或者其他一些检索条件进行检索。这样,就大大提高了检索服务响应的速度,节省了用户的时间,而且也丰富了图书馆的信息资源。

结束语

作为图书馆的未来发展趋势,数字图书馆在研究中遭遇了重重困难,知识的有效组织与发现就是一段时期内数字图书馆所面临的重要课题之一。数据挖掘作为方兴未艾的信息技术之一,由于其在数据组织、分析和知识发现等方面的巨大优势和对信息的深层挖掘能力,并随着硬件环境,挖掘算法的改进、应用的普及和经验的积累等,数据挖掘在图书馆的发展中将显示出强大的发展潜力和广阔的应用前景。

参考文献

[1]刘显显.基于数据挖掘的高校图书馆个性化信息推荐方法研究[D].辽宁大学,2013

[2]袁媛.数据挖掘在高校图书馆个性化服务中的应用研究[D].广州大学,2011