Web数据挖掘在个性化网络学习中的应用研究

(整期优先)网络出版时间:2019-07-08
/ 3
摘 要 网络中的海量数据造成了很多的学习者难以找到适合自己的学习模式,根据网络资源及传统的基于WWW的网络学习的特点,结合当今流行的Web数据挖掘技术对传统的网络学习模型进行了改造,本文提出了个性化的网络学习模型,更加符合学习者的个性需求。

关键词 Web数据挖掘;网络学习;个性化


1 问题的提出

网络学习是指将网络技术作为构成新型学习环境的有机因素,可以充分体现学习者的主体地位,以探究学习作为主要的学习方式。现在的网络技术的鲜明的特点之一就是海量的信息资源,若是仅仅通过静态网页发布的学习内容,网络学习者很可能会迷失其中。并且个人的学习能力、兴趣与习惯、学习基础都存在巨大的差异。相比之下,网络的学习方法和模式就显得十分单一,忽略了学习本身是一种个性化的过程,没有做到因人而异、因材施教,这就造成了两者之间越来越大的矛盾。随着Web数据挖掘技术的发展,网络学习的个性化问题越来越受到了重视,就是学习应当考虑学习者的个别需求和特殊的学习方式[1]。Web数据挖掘技术与网络学习相结合可以为学习者创造一个个性化的网络学习空间,提供符合其学习个性的服务,从而提高学习者的学习效率。

2 Web数据挖掘技术

数据挖掘是从大量的数据中抽取出潜在的、有价值的知识、模型或规则的过程。Web数据挖掘的对象是有关Web的数据,主要有Web页内容,如Web文档,Web结构数据如Web文档内的超链接,用户访问数据如服务器的log日志信息,相应的Web挖掘也分为三种:Web内容挖掘、Web结构挖掘、Web访问信息挖掘[2]

Web内容挖掘是对Web页面内容进行挖掘,从Web页的内容数据中发现信息。尽管人们可以直接从网上通过抓取建立索引,实现检索服务来获得资源,但是大量的“隐藏”信息只能通过内容挖掘来获得。Web结构挖掘是对Web页面之间的结构进行挖掘,主要针对的就是页面的超链接,文档间的超链接反映了文档间的某种联系,如果有较多的超链接指向某一页面,那么该页面的内容就是重要的,发现的这种知识可用来改进搜索路径,优化学习网站的链接,提高学习者获得资源的速度等。Web访问信息挖掘是利用用户和网络交互过程中抽取出来的数据,这些数据主要是用户在访问Web时在Web日志里留下的信息,包括:访问日期、访问次数、访问时间、用户IP地址、服务器IP地址、所请求URL资源等[3]。Web访问挖掘就是对这些数据进行挖掘,以发现有用信息,获得学习者的学习信息,作为提供服务的依据。Web数据挖掘的原理如图1所示。

1527301242.jpg

图1 Web数据挖掘原理


3 基于Web的传统的网络学习模型

传统的基于WWW的网络学习指的是将普通学习的环节(如上课、答疑、作业、测试等)放到网上来,学习者足不出户便可享受到网上学校提供的服务,在家里就可以浏览课件、进行提问、和其它学习者交流、参加测试等。传统的基于Web的网络学习是一种非实时的网络学习,需要由网络支撑系统的支持,传统的网络学习,以系统自身为中心,并没有充分考虑学习者的需求与习惯,要求人来适应系统而不是系统去适应学习者,使得没有充分按照学习者的学习规律来进行学习,所以造成了交互性差,学习效果不明显等诸多问题。传统的网络学习模型如图2所示。

所谓的“网络学习模型”在大多数网络学习站点中只是一个美观的界面而己,它并没有把下面五个子系统有机地结合起来,使之成为一个真正的网络学院,各个子系统有各自独立的数据库(包括学习者信息和各自所用的基本信息),界面所做的工作无非是提供指向各个子系统的链接。对于进行网络学习的学习者的行为不进行研究,忽视学习者行为这一重要信息。这样,原有的网络学习模型显得不太具有个性化,智能化的特点。所以Web数据挖掘技术的发展有了进一步发展的今天,具有个性化的网络学习显得更为重要。

1527306711.jpg

图2 传统的网络学习模型


4 个性化网络学习模型的构建

4.1 Web数据挖掘技术在个性化网络学习的应用分析

Web数据挖掘技术会对未来的个性化网络学习产生极大地推动作用。它既可以对学习者个人提供多种帮助,促进学者自身的个性化学习,又可以对网站的完善、优化提供依据,促进网站的个性化服务。

1)对学习者自身的帮助

(1)帮助学习者进行学习个性分析。不同的学习者具有不同的学习个性,但并不是每个学习对自己的学习个性都有充分的认识。应用Web数据挖掘技术对学习者所留下的信息进行挖掘,形成每个学习者的学习个性模型并将此模型以某种方式提供给学习者,用以帮助学习者进一步了解自己的学习状况、学习能力、学习兴趣等,从而修正自己的学习目标、学习计划、学习策略等。同时通过学习个性分析有助于发现学习者潜在的能力和兴趣,可以帮助其再次认识自己,增强自己的信心,激发学习热情,激发创业动力。

(2)提供可参照的知识体系。人们查阅大量的资料,获得大量的信息,目的是为了获得知识,通过大脑对信息进行加工处理,构建自己的知识结构,形成自己的知识体系,利用数据挖掘技术对用户所查阅的大量信息进行加工处理,通过获得的知识,构造知识体系,该知识体系虽然不能完全符合学习者的知识结构,但该知识结构可以作为学习者建立知识结构过程的

参考,通过参考对比,学习者可以进行学习的自我评价,可以及时发现自己是否偏离预定的目标,所查阅的资料是否真正是自己想要的,发现自己在学习过程中是否出现问题,这样的学习就可以少走弯路,提高学习效率,加快自己知识结构的建立。

(3)自动提供可用的学习资源。根据访问的内容,利用Web数据挖掘技术自动动态为学习者提供一些相关站点,相关链接,或自动捕获相关链接并自动对其进行分类,放入学习者的收藏夹,这样减少学习者搜索信息的时间又可以帮助其对信息进行有效地分类管理。

2)对网站个性化服务的促进[4]

(1)对网站的修改更加有目的、有依据。根据用户访问模式自动重构页面之间的链接,以符合用户的访问习惯,把用户想要的信息以更快、更有效的方式展现给用户,稳步地提高用户满意度。

(2)查看网站流量模式。发现用户的需要和兴趣,对需求强烈的网页提供优化,用服务器预先存储的方法来解决下载缓慢的问题。

(3)提供个性化网站服务。通过Web数据挖掘预测用户的兴趣爱好,针对不同的用户,按照其个人的兴趣和爱好,向用户动态提供浏览的建议,自动提供个性化的资源。

随着网络信息的剧增,利用计算机检索信息变得越来越困难。一方面收到的信息太多使学习者难于选择和消化;另一方面产生信息迷失,人们难于找到自己真正所需的信息。Web数据挖掘技术可以使该问题得到解决,它为网站运行提供深入、准确、详细的分析数据和有价值的分析知识,据此可以完善网站的个性化服务。

4.2 基于Web数据挖掘技术的个性化网络学习模型

个性化服务的根本就是尊重用户,研究用户的行为习惯与兴趣,为用户选择更需要的资源,提供更好的服务。Web数据挖掘(Web Data Mining)技术是网络学习个性化中的关键技术,Web数据挖掘是指在人为构造的WWW上挖掘有趣的,潜在的,有用的模式,以及隐藏的信息的过程[5]。Web数据挖掘技术的优点有:①不需要用户提供主观的评价信息。②可以处理大规模的数据量。③用户访问模式动态获取,且不会过时。④使用方便。

正是有了诸多的优点,可以很好的利用Web数据挖掘技术构建个性化网络学习模型,在个性化的网络学习中推荐给学习者的Web页面应当是学习者所喜欢的,这可以通过路径转移模式挖掘和预测来实现。如果我们将相似的Web页面推荐给学习者,在这里,相似性并不意味着这些Web页面在内容上相似,但是这些页面可能都是同一个学习者所需要和喜欢的。另外,这些推荐给学习者的Web页面对他们来说应当都是非常重要的[6]。Web页面的重要性意味着这些页面比其它页面具有更高的品质,也就是说,这些页面对学习者的网络学习更加有帮助。

因此,在网络学习个性化中需要用到适应性的Web数据挖掘技术,构建一个Web数据挖掘系统。这里用户(如指导者)可以对数据采集,转换步骤,以及模式发现和分析阶段进行严格控制。这样,用户就能够使数据挖掘适应于他们的需求和当前任务。问题是用户己经有传送在线课程的艰巨任务,不能再负担复杂的数据挖掘任务,然而,为了从学习者的行为历史记录中抽取有意义和有用的模式,他们需要反复的与Web数据挖掘系统交互。在设计系统时应当考虑到这一点。复杂的算法对用户是透明的,但是这些算法对于系统设计人员来说却能运用简单的过滤器和直接的查询语言通过模式发现来实现,从而对不同程度的系统进行控制。

模式发现算法用来发现Web使用数据中的趋势和关系。在这里,用户会提供一些有关这些算法的约束条件。这些约束条件用于引导知识发现过程以及限制搜索空间。陈述约束条件是用户与数据挖掘模型之间的惟一交互,因而用户不需要掌握复杂的数据挖掘算法知识。另一个要注意的是系统的体系结构允许数据挖掘模型中的新数据挖掘模型的即插即用,增加新的模式发现功能而不需要在系统中有太大的改变。最后的模式分析阶段,其目的是使得很容易给决策者解释已经发现的模式,并将模式可视化为直观的图表。在模式分析中应当增加查询语言以去除不相关的模式而将知识发现集中用到网络学习个性化推荐中。

基于以上考虑,在个性化网络学习中,运用了Web数据挖掘,聚类,关联规则等技术来实现高质量的个性化网络学习空间。以及结合传统的模型,提出了个性化的网络学习模型,如图3所示。

1527311105.jpg

图3 个性化的网络学习模型

5 结束语

得益于高速发展的互连网技术,人工智能和数据库技术,产生了一个新的研究方向——Web数据挖掘技术。Web数据挖掘技术的使用可以使资源系统了解用户交互行为数据中所包含的意义,因此该技术可以被广泛应用于个性化/推荐服务、资源优化/系统自适应、信息服务智能化、系统流量分析等领域。这些使个性化网络学习成为可能,也将使用户更多更高效地获取所需要的学习信息资源。

参考文献

[1] 石晶,龚震宇.基于Web挖掘的个性化服务技术 [J].计算科学,2002,(8):168~171

[2] 陈安,陈宁,周龙骧等.数据挖掘技术及应用[M].北京:科学出版社,2006

[3] 毛国君,段立娟,王实.数据挖掘原理与算法[M].北京:清华大学出版社,2005

[4] David Hand.数据挖掘原理.张银奎[M].北京:机械工业出版社,2003

[5] 韩家炜,孟小峰,王静等. Web挖掘研究[J].计算机研究与发展,2001,38(4):405~414

[6] 邹涛,王继成,朱华宇等.WWW上的信息挖掘技术及实现[J]。计算机研究与发展,1999,36(8):1019~1024