基于文本挖掘的核电运行事件致险因素探讨

(整期优先)网络出版时间:2024-05-18
/ 2

基于文本挖掘的核电运行事件致险因素探讨

严智超

江苏核电有限公司          江苏连云港      222000

要:准确、有效地对核电站操作经验进行有效的信息反馈,对提高核能系统的安全性具有重要意义。以2018-2022年我国核电运营事故案例为研究对象,运用文本挖掘技术,构造定制词典对其进行自动切分,实现对初始特征术语在报表中的特定表述的追溯,实现对事故风险要素的视觉表达,实现对事故风险要素的重视。研究发现,当前我国核电站安全事故的人为原因高达60.21%,其中人为原因的相关性要好于管理因素和装备因素。

关键词:核电厂;文本挖掘;运行事件;安全管理

相对于常规的基于统计学和专家经验的核能操作事故的研究,基于文本的数据挖掘能够更好地对数据进行深度解析。本文提出了一种基于数据挖掘的核电站事故风险评价模型,该模型能够反映出事故风险因子的重要程度,并对其进行了分析。为此,利用文本挖掘技术对核电运营事故通报进行深入研究,并将其应用于核电运营事故通报的风险评价中,提高风险评价的准确性。

1.文本挖掘的方法概要

本文采用文本挖掘技术,对多源文本数据进行处理和分析。首先,通过文本预处理,包括分词、去除停用词等步骤,提取文本中的关键信息。然后,运用词频分析、共现分析等方法,揭示核电运行事件致险因素之间的关系和规律。最后,通过聚类分析和主题建模,将相似的致险因素进行归类,形成可信度高的分析结果。

2.运行事件致险因素提取

2.1文本分词和特征降维

通过对核电站运营事故的统计分析,提取出的事故数据集包括:事故原因分析的数据集、事故原因分析的数据集、事故数据的半结构数据。在Python中引入CountVectorizer模块,使用sklearn软件包,设定一个合适的门限,对该文档进行矢量表达,然后对该语料进行切分,从而获得高维、稀疏的、具有核运算的事件的原始特征集。高维的文本特征集会对成因因子的抽取产生干扰,所以要对其进行降维。周茜等对中文文本的特征选取进行了比较,结果表明X2的选取优于IG及预期的互信息。陈晓云等通过比较信息增加(IG)、互信息(MI)及X2统计量(CHI),得出了在描述文字属性关联方面X2统计量优于互信息法。基于X2的数据降维算法无论在文字召回率还是准确率上都具有明显的优越性,其计算公式为:

公式中:n表示全文的数量;a是一种属于ci类别并含有一种特性术语t的文字频次;b是一个不是ci类别并且含有一个特性条目t的文字频度;c是一种属于ci类别的文字频度,但是不包括特性条目td是一个文字的频度,它既不是ci类别也不是t特性项目。然后,对全部语料进行以下公式表示的X2值:

设置m的数值可以剔除绝大多数的噪音单词,从而实现降维目的风险因子,并与Python的统计函数相融合,构造相应的同义词典,从而获得核电操作事件报道的文本特性降维和报表中的详细描述。

2.2致险因素提取

在对文本进行解析时,采用Python语言中的TfidfTransformer模块,对其进行矢量空间建模,使其能够方便地被挖掘出来。

定义一:文件D,将核能操作事故的第i个文件用Di表示。

定义二:文字特性术语,是一种可以反映文字特性的词语,词组等。

定义三:文字特性条目加权W,它是对运行事件报道文字D中的文字特性Tk的重要性,通常通过tf-idf公式来进行表达,其中包括:

定义四:在文本发掘过程中,按照上面的方程,将文本分割后抽取的各特征词语的相应权值,再把这些词语转换成一个空间矢量,再把这些词语的矢量集合组成这个文本的VSM

Python环境下,利用sklearn软件对核电站运营事故通报中风险因子的权值进行了标准化后,我们发现风险因子在风险因子中的权重并不显著,这与研究中涉及到的事故案例数量较少有关,所以我们没有采用常规的标准化方法。

3.核电运行事件致险因素分析及针对措施

3.1设备故障因素

设备故障是核电运行事件的主要致险因素之一。通过对文本数据的挖掘和分析,发现设备故障的原因主要包括制造隐患、设备老化、使用不当等。其中,核反应堆、冷却系统、控制系统等关键设备的故障尤为严重,一旦发生故障可能导致不可预见的事故。

针对设备故障问题,建议核电站加强设备的日常维护和定期检修工作,特别是对于核反应堆、冷却系统、控制系统等关键设备,应建立更加严格的维护和检修制度,确保设备运行的稳定性和安全性。

3.2人为失误因素

人为失误也是核电运行事件的重要致险因素。分析发现,操纵员的错误操作、不合理的维护计划、不严格的安全措施等都可能导致核电事故的发生。此外,管理不善、安全意识淡薄等问题也增加了人为失误的风险。

核电站应加强对操纵员的培训和模拟机技能水平提升,巩固他们的安全意识和提升操作技能,减少因人为因素导致的安全事故,同时让操纵员与其它核电厂联学联做,对标共同进步,实现人员技能卓越化。

3.3自然灾害因素

自然灾害是核电站必须面对的挑战之一。地震、洪水、海啸等自然灾害可能导致核电站设备损坏、电力供应中断等问题,进而威胁核电站的安全稳定。虽然自然灾害难以预测和避免,但通过加强预警系统建设、提高应急处理能力等措施,可以有效降低其带来的风险。

对于自然灾害等不可预测因素,核电站应建立完善的预警系统和应急处理机制,及时发现并应对可能的安全风险。同时,应加强与地方政府和相关部门的沟通协调,共同应对自然灾害等突发事件。

结束语:

综上所述,本文通过对多源文本数据的挖掘和分析,深入探讨了核电运行事件的致险因素。研究发现,设备故障、人为失误和自然灾害是核电运行事件的主要致险因素。为了提高核电站的安全生产运行水平,需要加强设备维护和检修、提高人员培训水平、强化安全管理措施等。未来研究可以进一步拓展文本数据的来源和范围,考虑更多可能影响核电运行安全的因素。同时,可以结合其他数据挖掘和机器学习技术,构建更加精准和有效的核电运行事件致险因素预测模型,为核电站的安全生产运行提供更有力的支持。

参考文献

[1]陈甲华,王平平.基于文本挖掘的核电厂运行事件致因分析[J].核安全, 2023(02):37-44.

[2]陈建华,雷润寰.基于文本挖掘的核电运行事件致险因素分析[J].南华大学学报:社会科学版, 2023(02):112-118.

[3]朱勇.核电运行安全影响因素研究与分析[J].中小企业管理与科技(下旬), 2021(02):66-68.

[4]胡伟华.核电站运行事件人误因素交互作用探究[J].产业与科技论坛, 2021(09):171-172.

[5]王兵.核电站运行事件人因失误因素交互作用分析[J].中国安全生产科学技术, 2022(03):35-37.