基于贝叶斯博弈的无线传感器网络防御模型研究

(整期优先)网络出版时间:2011-04-14
/ 2

基于贝叶斯博弈的无线传感器网络防御模型研究

李平

李平山东理工大学计算机学院255091

摘要本文基于贝叶斯博弈理论,形成了攻击者和防御者之间的博弈过程,构建了一个防御模型,并证明了该模型中存在贝叶斯纳什均衡。而且在提高检测率的同时能有效的利用节点能量,表现出较高的能量效率。最后通过实验证明了该模型的有效性。

关键词贝叶斯博弈无线传感器网络入侵检测

一个无线传感器网络(wirelesssensornetworksWSN)包含成百上千个低能量低消耗节点,这些节点通过无线的方式进行通信[1],网络的运转完全依赖于节点间的相互协作,每个节点除了要采集数据,还要充当路由功能,转发数据[2]。无线传感器网络易于遭受传感节点的物理操纵、传感信息的窃听、拒绝服务攻击、私有信息的泄露等多种威胁和攻击。无线传感器网络作为一种起源于军事应用领域的新型自组织网络,又是主要采用射频无线通信组网,其安全问题显得尤为重要[4]。

入侵检测系统(IntusionDetectionSystemIDS)在网络安全方面起到了非常重要的作用。一个好的网络防御,一般每个节点上都要配置IDS,而每一个IDS都应该始终处在激活状态。因为无线传感器网络节点能源的限制[6],如果每一个IDS的始终处在激活状态,会消耗大量的能量,这是不现实的。那么如何在能量消耗的限制条件下,使得整个防御机制变得更加有效呢?博弈理论为我们的研究提供了很好的平台。

博弈论[7]是研究决策主体行为依赖的理论,而行为依赖正是网络安全中最基本的特征。防御者会根据当前网络受攻击的威胁程度来进行相应的安全管理和配置;而攻击者也会对目标主机的防御能力进行探测和估计,从而选择某种攻击方式或不进行攻击。博弈论中,贝叶斯博弈是非合作的不完全信息博弈,能很好的模拟现实中攻击者和防御者的攻防特征[8,9]。本文就是基于贝叶斯博弈理论,将攻击者和防御者之间理解为一种博弈过程,提出了一个无线传感器网络的防御模型。

贝叶斯博弈模型

该模型中有2个参与者(players),参与者和参与者。参与者的类型有两种,一种是恶意节点,能够对网络造成一定的威胁和破坏,记为;另一种是正常节点,不会对网络造成任何破坏,记为。参与者是带有IDS的检测节点,能够检测和阻止恶意节点的攻击,它只有一种类型,正常的IDS,记为。参与者的类型是私有信息,参与者不知道参与者是恶意节点还是正常节点。而参与者的类型是公共信息。参与者,如果是恶意节点,它有两种纯策略:和;如果是正常节点,只有一种纯策略,。参与者只有一种类型,正常的IDS,它也有两种纯策略,和。在博弈过程开始时,参与者双方同时选择自己的行动策略。

假设防御者保护网络安全的价值为,且。而就表示网络受到攻击后的损失。防御者的检测成本用来表示,攻击者发起攻击的成本用来表示,。显然,,否则恶意节点就没有动力发动攻击,而防御者也没有动力检测了。在资源受限的无线传感器网络中,检测和攻击的成本都可以理解为在这一过程中产生的能量消耗。表示IDS正确检测出恶意节点的概率,是IDS发出错误警报的概率。。

2.贝叶斯纳什均衡分析(BayesianNashEquilibriumBNE)

博弈论中通常都会假设参与者是理性的,并且都想最大化它们的收益。假设参与者对参与者的类型有一个先验概率,认为参与者是恶意节点的概率为,那么是正常节点的概率就是。在贝叶斯博弈中,为了求解纳什均衡,通过海萨尼(Harsanyi)转换[7],引入自然(Nature)的概念,由自然决定参与者是哪一种类型。这样对于参与者来说,就可以计算出如果他采取某种策略,可能实现的期望值。通过比较不同的期望值,就能得出应该选择的策略,而参与者知道参与者会按照期望值的大小来决定相应的策略,因而参与者相应也知道他应该采取什么样的策略。

当参与者采取纯策略(恶意节点,正常节点)时,参与者采取纯策略时的收益期望为:

参与者采取纯策略时的收益期望为:

令,那么,对于参与者来说,最好的策略就是。然而参与者采取了策略,参与者的最优策略就是,因此((恶意节点,正常节点),)不是一个BNE。但是当时,参与者的最优策略就是,而此时,参与者选择策略是最优的,所以((恶意节点,正常节点),)是一个纯策略的BNE。

当参与者采取纯策略(恶意节点,正常节点),那么参与者的最优策略就是。当参与者的采取了策略,接着恶意节点的反应策略就是,又回到了上面讨论的情况,所以((恶意节点,正常节点),)不是一个BNE。

在上面的讨论中,当时,不存在纯策略的纳什均衡,但是却存在一个混合策略的纳什均衡。令表示参与者采取策略的概率,表示参与者采取策略的概率。那么参与者采取策略时的收益期望为:

参与者采取策略时的收益期望为:

令,得到,这时,对于参与者来说选择或是没有区别的,也就是说参与者的均衡策略就是以的概率选择策略。同理,通过计算,可以得到,这时,对于参与者来说,选择或也是没有区别的,参与者的均衡策略就是以的概率选择。所以组合策略((恶意节点,正常节点),,)是一个混合策略的贝叶斯纳什均衡。

3.实验及结果分析

通过GAMBIT[10]博弈分析工具对贝叶斯博弈模型进行实验,并分析了实验结果。

其中,,=0.01,=0.01,={0.1,0.4,0.7}。随着IDS正确检测恶意节点的概率的变大,恶意节点采取攻击行为的概率就越小,而且根据先验概率取值的不同,实验结果有很大的差距,当一开始就判定参与者是恶意节点的概率较大时,恶意节点选择攻击策略的概率控制在0.1以下。

IDS发出错误警报的概率,对参与者中恶意节点选择策略的影响。其中,=0.7,=0.01,={0.1,0.4,0.7}。随着IDS误报率的不断增大,恶意节点采取攻击行动的可能性就越高,而且随着先验概率的取值不同,实验结果有较大的差距。

概率是IDS的正确检测出恶意节点,对参与者选择策略的影响。其中,=0.01。随着IDS正确检测出恶意节点的概率的不断增大,参与者采取防御策略的概率不断减小,也就是可以减少检测的次数,达到高效检测的目的,进而节省节点能量。

参与者选择策略的影响:其中,,=0.7,=0.1,=0.8。是参与者的防御成本和成功检测的收益之间的比值,值越小,越能够激励IDS执行策略,那么参与者选择策略的概率就会越小。当=0时,恶意节点攻击的概率也接近于0。

对参与者选择策略的影响:其中,,=0.7。

表示参与者执行策略的成本与攻击成功的收益之间的比值。随着这个值的不断变大,成本和收益之间的差距就越来越小,从而使得恶意节点攻击的动力越来越小,那么防御者检测的概率也越来越小,当=1时,防御者就不用检测了。

从实验中可以看出,基于贝叶斯博弈的无线传感器网络的防御模型能很好的反应恶意节点和防御者之间的攻防关系,能预测恶意节点采取攻击行为的概率,还能预测IDS采取防御策略的概率。另外,对于IDS来讲应该通过提高正确检测的概率,降低误报率,来减少攻击行为的发生,并且还能节省能量。在实验中,还发现先验概率的取值对防御过程的影响很大,如何很好的确定先验概率的值,也是一个值得深入研究的问题。

4.结束语

本文提出的贝叶斯博弈防御模型能够模拟防御无线传感器网络中的多种的攻击类型,防御者可以根据贝叶斯纳什均衡解采取有效的检测策略,最大化自己的收益。但是,确定一个合理的先验概率是一个难点。在实际的应用中,防御者可以根据它对网络环境的认知来确定的值,例如,如果传感节点处在敌对的环境中,就可以设置一个较大的值。

在博弈过程中,假设每一个节点的行为都不受其他节点行为的影响,所以当多种类型的攻击同时进行时,该贝叶斯博弈模型不能很好的防御,这也将是以后研究的一个方向。

参考文献

【1】陈林星.无线传感器网络技术与应用[M].北京:电子工业出版社,2009.

【2】I.F.Akyildiz,W.Su*,Y.Sankarasubramaniam,E.Cayirci.Wirelesssensornetworks:asurvey[C].ComputerNetworks,38(2002)393-422.

【3】AndreasA.Strikos.AfullapproachforIntrusionDetectioninWirelessSensorNetworks[C].ComputerNetworks,2007.

【4】王殊,阎毓杰,胡富平等.无线传感器网络的理论及应用[M].北京航空航天大学出版社,2007.

【5】李剑等.入侵检测技术[M].高等教育出版社,2008.

【6】JongdeogLee,KrasimiraKapitanova,,SangH.Son.Thepriceofsecurityinwirelesssensornetworks[C].

ComputerNetworks,54(2010).2967-2978.

【7】姚国庆.博弈论[M].北京:高等教育出版社,2007.