基于极限学习机的热工系统辨识研究

(整期优先)网络出版时间:2023-10-14
/ 3

基于极限学习机的热工系统辨识研究

李秋影、孙青琳

山东电力工程咨询院有限公司,山东济南250000

摘要:由于热工系统的非线性和不确定性,传统机器学习算法在对其进行辨识时,往往会出现学习速度慢、易陷入局部最小值的现象。针对这个问题,本文提出了一种基于极限学习机(ELM)的辨识方法。该算法具有参数设置简单、无需迭代寻优的特点。仿真结果表明,在热工系统辨识中,极限学习机算法在辨识速度和辨识精度上都有着明显的优势。

关键词:极限学习机;热工系统;辨识;数据

0 引言

随着新型仪表以及传感技术的普及应用,热工系统的运行数据变得容易获得。这些数据蕴含着生产过程中的诸多特性。因此,利用运行数据已经成为热工系统研究的重要手段[1]。对于热工系统,模型的建立是对系统进行研究的首要条件,基于数据的建模算法已经引起了人们越来越多的关注。目前,在系统辨识中应用比较广泛的算法主要有神经网络、小波网络、模糊理论、遗传算法等[2]。然而,热工系统的非线性和不确定性使得这些方法在模型结构选取及训练上仍存在问题,限制了其实际应用[3]。例如,BP、SVM等传统神经网络存在易收敛速度慢甚至不能收敛、过拟合问题、设置参数多等缺点[4]。因此,探索一种具有结构简单、辨识迅速、精度高等特点的热工系统辨识算法有很强的研究意义。

为了增强构建网络的整体性能,Huang G.B等人在2004年提出了极限学习机(Extreme Learning Machine,ELM)的概念[5]。它是一种新型的单隐层前馈神经网络(single-hidden-layer feed forward neural networks,SLFNs)。该算法可随机选取隐含层神经元参数,且能够利用隐含层输出矩阵的广义逆经一步计算出网络的输出权值。相对于其他智能算法,极限学习机确定网络参数的时间得以大大缩短。

极限学习机以其参数设置少、无需迭代运算的优点,引起了越来越多学者的应用研究。目前,极限学习机已经在模式分类、建模、预测、控制器设计中取得了应用[6]。本文将极限学习机算法引入到热工系统辨识中,并将辨识结果与BP神经网络和支持向量机进行比较。仿真结果表明,极限学习机能够快速准确地辨识出热工系统,是一种简便易操作的辨识算法。

1极限学习机算法

极限学习机算法是一种单隐层前馈神经网络算法。该算法主要有两方面特点:(1)随机产生输入层与隐含层间的连接权值及隐含层神经元的阈值,且无需调整;(2)隐含层输出权值是通过最小化平方损失函数得到的最小二乘解。因此,极限学习机只需设置隐含层神经元个数,无需进行迭代运算,便可以获得唯一的最优解[7-8]。与传统的训练算法相比,该方法具有学习速度快、辨识精度好等优点,在近几年得到了广泛关注。

结合神经网络的知识,易得具有Q个训练样本(xt)L个隐含层神经元的ELM输出表达式为:

(1)

其中,ωi为输入层到第i个隐含层神经元的连接权值;bi为第i个隐含层神经元的阈值;βi为第i个隐含层神经元的输出权值;g(x)为激活函数,f(x)为网络的输出。

若网络输出无限接近样本值,即fL(xj) →tj,那么用矩阵形式表达就有:

(2)

其中,H为隐含层输出矩阵,具体形式如式(3)所示:

(3)

与传统神经网络相同,当激活函数g(x)确定时,网络训练完成的标志即为确定ωbβ。Huang G.B等通过证明得出,当激活函数g(x)无限可微时,SLFNs的参数并不需要全部进行调整,ωb在辨识前可以随机选择,且在辨识过程中保持不变[5]。那么在这种情况下,只需确定β值便能完成网络的辨识。β可通过求取最小化平方损失函数的最小二乘解获得,其数学公式表示为:

(4)

其解为 (5)

其中H+为隐含层输出矩阵H的Moore-Penrose广义逆。 

2辨识步骤

通过上文的理论分析可以看出,极限学习机不需要进行迭代寻优,故辨识速度得到很大的提升。基于极限学习机的模型辨识主要步骤如下:

(1)辨识数据处理:分析系统确定输入输出变量,采集数据并对数据进行预处理,如归一化处理等。

(2)网络参数确定:ELM参数确定相对比较简单,只需确定隐含层神经元数目以及激活函数。

(3)系统辨识:利用输入输出数据对系统进行辨识。

(4)性能评价:利用辨识时间以及均方误差来对网络的辨识结果进行评价。

3 仿真实例

本文分别对Box-Jenkins煤气炉数据和火电厂仿真机数据进行辨识,以验证基于极限学习机的辨识方法在热工系统中的可行性。此外,将辨识结果与BP神经网络、支持向量机法的辨识结果进行对比分析,以验证其准确度和可靠性。为了消除数据之间的量纲影响,本文采用公式对数据进行归一化处理,归一化之后的数据都在[0,1]之间;辨识完成之后,再对其进行反归一化处理。辨识性能好坏采用均方误差和辨识时间t来评价。均方误差越小,说明辨识精度越高;辨识时间越短,说明辨识越迅速。

3.1 Box-Jenkins煤气炉数据辨识

Box-Jenkins煤气炉数据在众多文献中被引用,该数据被认为是用于检验辨识方法是否有效的标准实验数据[9]。它是一个由296组数据组成的单入单出系统,输入u(t)是煤气的流量,输出y(t)是CO2浓度。u(t)取值范围为[-3,3],y(t)取值范围为[46,61]。

相对于BP神经网络和支持向量机来说,极限学习机参数确定比较简单。它只需确定两个参数:激活函数和隐含层神经元数目。激活函数设为sigmoid函数;隐含层神经元数目通常采用试凑法来完成。ELM的均方误差随隐含层神经元数目变化的趋势如图1所示。均方误差随着隐含层神经元数目的增加不断减小,当神经元数目≥100以后,网络的误差趋于平稳,因此选定ELM的隐含层神经元数目为100。SVM参数类型设为e-SVR,核函数为径向基,参数-c设为1000,其余均设为默认值。BP神经网络的神经元数目设为100,激活函数为sigmoid函数,学习步长为0.01,最大训练次数为1000。

图1 ELM的均方误差随隐含层神经元个数变化曲线

根据上文设置的参数进行仿真实验后,极限学习机的辨识曲线和误差曲线如图2所示。BP神经网络、支持向量机和极限学习机三种方法的辨识结果见表1,为保证结果的准确性,表中数据取5次实验结果的平均值。

2(a)极限学习机的辨识曲线        2(b)极限学习机的辨识误差曲线

表1 三种方法的辨识结果比较

BP

SVM

ELM

辨识时间t(s)

1.0370

1.2335

0.0312

辨识误差MSE

1.8072

0.3126

0.3864

从图2可以看出,针对Box-Jenkins煤气炉数据,极限学习机算法可以较好地辨识出煤气炉的CO2浓度。对比表1中数据可知,在辨识速率方面,极限学习机的辨识速度约为BP神经网络的33倍,约为支持向量机的40倍;在辨识精度方面,其辨识精度约为BP神经网络的5倍,略低于支持向量机的识别精度。

3.2仿真机数据辨识

火电厂仿真机能够对火力发电机组给予全面的仿真。它不仅能够模拟真实设备的运行状况,还可以模拟真实的热工过程。因此,利用仿真机数据的辨识研究对真实的电厂热工系统研究具有一定的借鉴和指导意义。本节将对某600MW火电厂仿真机的给煤量-主汽压力系统进行辨识。给煤量-主汽压力系统采集到的数据如下:采样时间TS=1s,数据点个数N=1461,在100%负荷工况下,给煤量由220.34t/h阶跃减少至200.00t/h,主蒸汽压力从24.11MP逐渐降低至20.21MP。其变化趋势如图3所示。

3(a)给煤量变化趋势曲线            3(b)主蒸汽压力变化趋势曲线

极限学习机的激活函数设为sigmoid函数。通过进行均方误差随着隐含层神经网络变化的仿真实验,最终确定极限学习机的神经元数目为110。SVM参数中类型设为e-SVR,核函数为径向基,参数-c设为1000,其余均设为默认值。BP神经网络的神经元数目设为110,激活函数为sigmoid函数,学习步长为0.01,最大训练次数为1000。

依据上文设置的参数进行仿真实验,获得实验数据和曲线。极限学习机的辨识曲线和误差曲线如图4所示。针对给煤量-主汽压力系统,BP神经网络、支持向量机和极限学习机三种方法的辨识结果如表2所示,为保证结果的准确性,表中数据取5次实验结果平均值。

图4(a) 极限学习机的辨识曲线               图4(b)极限学习机的辨识误差曲线

表2 三种方法的辨识性能比较

BP

SVM

ELM

辨识时间t(s)

14.7871

0.43787

0.0624

辨识误差MSE

0.00338

0.00478

5.5049 e-07

从图4可以看出,极限学习机算法较好地拟合了主蒸汽压力的变化曲线。对比表2中数据可知,在辨识速度方面,极限学习机约为BP神经网络的237倍,约为支持向量机的7倍;在辨识精度方面,极限学习机约为BP神经网络的6100倍,约为支持向量机的8700倍。针对此给煤量-主汽压力系统,极限学习机算法无论在辨识速率还是辨识精度方面都远远优于其他两种方法。

4 结论

极限学习机具有参数设置简单,辨识速度快,辨识精度高的优点。本文将其用于热工系统辨识,分别选取通用的Box-Jenkins煤气炉数据和火电机组仿真机中的给煤量-主汽压力系统数据进行了仿真实验。与BP神经网络、支持向量机进行对比,极限学习机算法在辨识速度和辨识精度上都有着明显的优势。

参考文献

[1]刘长良, 任燕燕, 王东风等. 热工系统Hammerstein-Wiener模型辨识[J]. 计算机仿真, 2013, 30(9):394-397. DOI:10.3969/j.issn.1006-9348.2013.09.092.

[2]焦嵩鸣,韩璞,黄宇等. 模糊量子遗传算法及其在热工过程模型辨识中的应用[J]. 中国电机工程学报,2007,27(5):87-92.

[3]周丽春,刘毅,金福江.一种非线性系统在线辨识的选择性递推方法[J]. 化工学报, 2015, (1). DOI:10.11949/j.issn.0438-1157.20141481.

[4]杨易旻. 基于极限学习的系统辨识方法及应用研究[D]. 湖南大学,2013.

[5]Huang G B,Zhu Q Y,Siew C K. Extreme learning machine:a new learning scheme of feed forward neural networks [C]. In Proceedings of the International Joint Conference on Neural Net works (IJCNN 2004). Budapest,Hungary,July 2004: 985–990.

[6]郭晨龙. 极限学习机及其在分类问题中的应用[D]. 郑州大学,2013.

[7]王智慧. BP 神经网络和 ELM 算法研究[D]. 中国计量学院,2012.

[8] 潘红芳,刘爱伦. 小波核极限学习机及其在醋酸精馏软测量建模中的应用[J]. 华东理工大学学报:自然科学版,2014,(4).

[9]George B. Time Series Analysis: Forecasting & Control, [M]. Pearson Education India, 1994.