简介:摘要:体系作战具有作战过程复杂、态势变化快、决策空间大、对抗强度高的特点,采用人工智能算法可以辅助指挥员。面向体系对抗为场景,提出一种改进DDPG(深度确定性策略梯度)的深度强化学习算法。该算法通过状态依赖探索技术(state-dependent exploration,SDE),为智能体动作添加一个与状态相关的探索函数,提高算法的收敛性和策略生成的准确性。对比实验表明,该方法优于原始DDPG算法,可以提升体系对抗作战自主决策能力,有效可行。
简介:摘要:在无人机诱骗设备中,欺骗信号的生成与传统卫星信号模拟器具有很大的区别,其需要考虑信号的同步性,轨迹的高动态变化,外部探测输入信息等多种因素。本文介绍了一种欺骗式无人机卫星导航信号生成方法,该方法已成功应用于无人机诱骗设备中,达到了很好的效果。