CSA工业互联网安全研究团队第29期组会召开 - 河南科技大学河南省网络空间安全应用国际联合实验室/河南省智能制造大数据发展创新实验室

CSA工业互联网安全研究团队第29期组会召开

2025-07-28

7月27日，CSA工业互联网安全研究团队组会召开，会议由国际联合实验室博士生赵可景主持。本次组会主题是一种结合图注意力网络和多信号差分奖励的深度强化学习方法，用于解决动态混合车间调度问题。

河南科技大学2024级硕士研究生李晓格汇报了论文《A Deep Reinforcement Learning Approach with Graph Attention Network and Multi-Signal Differential Reward for Dynamic Hybrid Flow Shop Scheduling Problem》，文献提出了一种端到端的基于深度强化学习的调度方法，直接分配未调度的作业，一旦训练完成即可应用于任何规模的混合流程车间；开发了一种基于图的状态表示方法，用于观察混合流水车间的瞬时状态，该方法将作业的全局特征和局部特征合并到图注意力网络中，以获得待执行操作的概率分布；设计了一个多信号差分奖励（MSDR）函数，引入额外的奖励信号并生成中间差分奖励，这显著缓解了奖励稀疏性问题。结果证明所提出的模型在各种场景下表现良好，确认了其跨不同上下文的泛化能力。

图片1.png

图片2.png

图文/李晓格审核/赵可景）

微信扫码分享