车联网中基于强化学习的物理层安全资源分配方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:g2gstock
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能网联汽车和移动通信的发展,车辆通信和车联网在生产和生活中越来越普遍,信息安全是重中之重。然而,窃听设备的计算能力不断提升、通信设备的数量不断增加,传统的加密算法具有一定的局限性。物理层安全是传统的加密方案的一种补充技术,近年来是学术界的研究热点。资源分配是物理层安全的分支之一,主要从优化和信号处理的角度,利用资源调度有意地扩展合法信道和窃听信道的差异来提高保密性能。传统的物理层安全资源分配算法通常建模为一个优化问题,在一个计算中心的调度下,为所有用户分配资源。在环境变化迅速的车联网中,有些问题难以建立确切的数学模型。优化问题中保密容量由于其对数减法性质往往是非凸的,很难求得解析解。同时,车辆通信要求极低时延,而集中式的计算中心会产生额外的时延和开销,难以满足车辆通信的时延要求。因此,本文提出了基于强化学习的物理层安全资源分配方法,取得了如下创新性成果:针对传统资源分配算法中时延的优化问题以及优化模型难以求得解析解的问题,本文提出了一种基于深度强化学习的集中式资源分配方法。该方法将基站设计为一个深度强化学习智能体,通过设计合适的状态、动作和奖励,同时优化V2V保密通信的时延和V2I链路的系统保密速率,仿真显示该方法实现了优秀的系统性能。针对集中式资源分配算法中由于计算中心导致的额外时延和开销,本文提出一种基于多智能体强化学习的分布式资源分配方法。该方法将每条V2V链路的发送车辆设计为一个智能体,系统中的每个智能体根据自身的局部观测,自动选择资源块和功率。该方法设计了独特的状态、动作和奖励,解决了多智能体系统中环境的不稳定性,并使分布式的智能体合作提高系统性能。该方法避免了集中式资源分配问题中产生的额外时延和开销,获得了接近单智能体方法的系统性能,保证了车辆通信的保密性和时延要求。
其他文献
如今,城市中心的交通拥堵状况相当严重,这使得人们的出行变得愈发困难。因此,短时交通流量预测受到了越来越多学者的关注和研究。然而,传统的短时交通流量预测研究大多是对单
二维条码作为一种高信息集成、强抗干扰能力的编码方式,在移动终端以及工业流水线上普遍运用。其中QR码因为其独特的定位特征以及快速响应特性常见于各类移动终端,Data Matri
丁苯橡胶作为世界上最先实现工业化生产的橡胶,其加工性能优良、制品的使用性能好、运用范围广,在汽车、电器、水利等领域广泛使用。本文通过分子量不同的改性剂对硅粉进行改
随着计算能力的提升,以及神经网络的发展,越来越多的学者投身于生成式模型的研究。生成式对抗网络,通常可以简称为GAN,是一种在当前十分流行的生成式模型。自最原始版本的生
17世纪开始,底特律从一个殖民定居点逐步发展起来。19世纪,依托大湖区便利的交通条件和丰富的矿产资源,底特律从一个小城市逐步发展成为美国重要的工业城市,并在20世界初,依
豉香型白酒的传统工艺饼曲是一种具有代表性的小曲种类,曲的品质能够影响酒的质量和出酒率,曲中的不挥发性化合物能够决定微生物的生长,同时也是重要的风味前体物质,但小曲中
液力透平是一种利用液体的动能及压能做功的多级涡轮式流体原动机,特别适用于工业流体(液体)高压能的回收利用,利用液体的高余压产生旋转动力,带动发电机发电,或带动水泵、风
发动机内部燃烧流动过程极其复杂,机理仍未明晰,现有的燃烧诊断技术无法实现对湍流燃烧过程的瞬时三维测量。火焰的化学发光能够实时反映燃烧状态与火焰的结构信息,计算断层
本文针对现有承力框架熔模精密铸造成形存在的缩松铸造缺陷严重问题,采用Procast计算机数值模拟软件并基于现有产品缺陷情况,预测熔模精密铸造成形承力框架缩松缺陷的产生,通
近年来,随着智能监控系统的广泛应用以及计算机视觉技术的不断发展,群组行为识别已经成为智能视频监控领域中的关键技术,对于公共安全、人机交互和视频分析等领域具有重要的