计算机科学与技术学科研究热点及前沿分析

(整期优先)网络出版时间:2023-11-11
/ 2

计算机科学与技术学科研究热点及前沿分析

殷家恒尉凯

610424199601280018610321198903130614

摘要:文章以南昌大学、江西师范大学等江西30所高校为研究对象,以中国学术期刊全文数据库收录的计算机科学与技术学科领域的高被引论文(排名前10%)及科学引文索引(SCIE)收录的计算机科学与技术学科领域的论文为数据基础,对作者关键词词频及年度分布进行了统计分析。研究发现:国内外该领域持续研究30次以上的热点集中在特征提取、深度学习、卷积神经网络、粒子群优化、支持向量机、图像分割、图像处理、云计算等关键词上;近期研究前沿集中在任务分析、许可证、人工智能、能源效率等关键词上;具有发展潜力的研究方向有可能在计算建模、隐马尔科夫模型、混合有源滤波器、智能系统、分析模型、跌倒检测等关键词中产生。

关键词:研究频次;高被引论文;SCIE论文

引言

对某一时刻正在关注的热点领域,涌现的具有发展潜力的研究方向和科学研究中最先进、最新的研究主题进行的科学分析,可以为研究人员提供所关注领域的研究动态,找到具有价值的研究方向或潜在研究领域。学科研究热点与学科发展前沿是一个学科发展的航向标。关键词是分析研究领域内热点前沿问题的重要抓手,分析高频关键词是挖掘热点问题的常用方法。为了探索计算机科学与技术学科的研究热点及前沿问题,文章采用2011—2020年江西高校计算机科学与技术学科排名前10%的高被引论文的关键词,以及被SCIE收录论文的关键词词频数据进行统计分析,以期为相关人员提供参考。

1数据来源和统计方法

1.1数据来源

文章以中国高校科研成果统计分析数据库、中国学术期刊全文数据库(CNKI)、科学引文索引(SCIE)为数据统计来源。

1.2检索策略

首先,分别以南昌大学、江西师范大学等江西省30所高校名称为检索词,在中国高校科研成果统计分析数据库中,检索下载江西高校“计算机科学与技术”学科,2011—2020年排名前10%的高被引论文数据条目,然后再通过获取到的排名前10%高被引论文的题名或作者等字段信息,在CNKI中检索下载到对应论文的关键词,检索截止时间分别为2021年4月15日和2021年11月26日。其次,在SCIE数据库中,选择机构扩展输入江西30所高校的英文名,进行检索,并利用Incites工具软件,精练出2011—2020年间,江西高校“计算机科学与技术学科”被SCIE收录的文献类型为Article的论文信息,数据采集时间为2021年12月8日。

1.3数据处理和统计方法

利用Excel对数据进行去重和统计分析。

2高被引论文分析

2.1关键词研究概览统计分析

关键词概括了研究者的主要内容、学术思想和主要研究方法,能够反映文章的研究方向和范围,是科学定量研究的重要指标。某个学术领域的研究热点反映的是在某一时期内研究人数多、研究范围广、研究层次深的问题,其中关键词作为一篇文章的核心凝练,其出现的频次能够较为准确地反映这一时期该领域的研究热点内容。关键词出现的频次越多,说明该研究比较火热。根据数据透视结果显示,江西30所高校2011—2020年,计算机科学与技术学科排名前10%的655篇高被引论文,共涉及关键词2162个,词频累计2892次。词频在10次及以上的关键词有11个,仅占2162个的0.51%,其词频为191次,占2892个的6.60%;词频在2~9次的关键词有298个,占2162个的13.78%,其词频为848次,占2892个的29.32%;词频为1次的关键词有1853个,占关键词2162个的85.71%,其词频为1853次,占2892个的64.07%;说明该学科领域内的研究方向既分散又高度集中。其中词频在10次以上的关键词依次是图像处理、图像分割、深度学习、机器视觉、卷积神经网络、特征提取、云计算、支持向量机、边缘检测、主成分分析、目标跟踪。被研究最多的关键词是图像处理。

2.2热点关键词研究趋势分析

为了进一步探究计算机科学与技术学科研究热点的趋势,文章对关键词的年度分布进行了统计分析,从时间维度展现了这些关键词在不同时段研究的演化过程。词频在10次及以上热点研究趋势分析研究热点是指在某一时间段内,有内在联系的、数量相对较多的一组论文所探讨的问题或专题。数据显示,卷积神经网络是近4年才出现的研究热点;图像处理、机器视觉等关键词研究的时间跨度长,是该领域被持续关注的热点;在这些研究热点中,图像分割、云计算及主成分分析的研究基本处于逐年减少的趋势,在2020年也无学者研究,其他热点都得到了持续的关注,这部分热点的研究可能还会持续一段时间。为了全面揭示该领域近期的研究热点和未来研究方向,文章进一步统计了2018—2020年新出现的关键词共654个,其中词频为3次的关键词有10个,词频2次的关键词有40个。表2列出了这3年新出现且2020年有研究的关键词研究情况。数据显示,近3年新出现且词频在2次以上的关键词有直方图、迁移学习、矩阵分解、区块链、移动边缘计算、形态学滤波、无人机、残差网络、长短期记忆神经网络等,是近期该学科领域内新的关注点。另外,2020年新出现的关键词一共有161个,词频2次以上的关键词有4个,词频1次的关键词有157个,未来的研究方向可能从中产生,如区块链、智能合约、教学改革与实践、差分隐私、三维人脸识别、无监督学习、同态加密、人脸超分辨率、火焰图像识别等。

32011—2020年SCIE论文关键词分析

3.1关键词概览

在SCIE中,选择机构扩展输入江西30所高校的英文名,进行论文检索,并利用Incites工具软件,精练出2011—2020年间,江西高校“计算机科学与技术学科”被SCIE收录的论文共2592篇,数据清洗后剩余2340篇。然后利用Excel对这些论文的作者关键词进行数据清洗及同义词聚类。表4数据显示,2340篇SCIE论文共涉及关键词7384个,其中词频在10次以上的关键词有66个,占7384个的0.89%,其频次为1196次,占累计频次11144次的10.73%,研究热点相对集中且具有一定的持续性;词频2~9次的关键词有1301个,占7384次的17.62%,其频次为3931次,占11144次的35.27%;词频为1次的关键词有6017个,占7384次的81.49%,其频次为6017次,占11144次的53.99%,从统计数据可看出,该领域研究的关注点既集中又分散。

3.2研究热点的趋势分析

近3年研究热点2018—2020年涉及的关键词共4161个,其中,词频在2次及以上的关键词有531个,占4161个的12.76%,近3年研究热点主要集中在Taskanalysis、Licenses、Artificialintelligence、Energy-efficiency等关键词上,表6列出了最近3年词频在6次以上的关键词。最新研究前沿和未来方向通过数据透视,对2020年新出现的关键词进行了数据统计,从中能较好地判断该领域最新的研究热点和预测未来的研究方向。根据数据透视结果显示,2020年新出现的关键词有1725个,占关键词总量7384次的23.36%,其频次1923次,占累计频次总量11144次的17.26%,该学科领域最新的研究前沿和未来研究方向有可能从中产生。表7中列出了词频在3次以上的最新出现的关键词。

结语

结语通过对江西高校计算机科学与技术学科国内高被引论文及SCI论文的关键词分析,揭示了2011—2020年该领域的研究热点和前沿。(1)通过高频关键词分析发现,2011—2020年该领域国内外的研究热点主要集中在特征提取、深度学习、卷积神经网络、粒子群优化、支持向量机、图像分割、图像处理、云计算等关键词上,其中特征提取研究最多。(2)从关键词近3年来研究频次的年度统计结果显示,计算机科学与技术学科领域近三年研究前沿集中在Taskanalysis、Licenses、Artificialintelligence(AI)、Energy-efficiency等关键词上。

参考文献

[1]百度百科.研究前沿分析[EB/OL].[2022-06-26].

[2]柯平,王洁,包鑫,等.2020年国外图书馆学研究热点与前沿分析[J].文献与数据学报,2022,3(2):13-34.

[3]王雅洁,朱瑞方,韩世范,等《.中西医结合心脑血管病杂志》近10年高被引论文特征分析:以编辑为视角[J].图书情报导刊,2022,6(5):70-74.