2026年4月12日,CSA工业互联网安全研究团队组会召开,会议由国际联合实验室博士生赵可景主持。本次组会主题是发现**先进的强化学习算法。
河南科技大学2024级博士研究生权高原汇报了《Discovering state-of-the-art reinforcement learning algorithms》。文献在大量复杂环境中,基于大量智能体的经验积累,进行元学习(meta-learning)。方法能够发现智能体在更新策略与预测时所遵循的强化学习规则。该团队还进行了大规模实验,结果发现这一自动发现的规则在经典的Atari基准测试上超越了所有现有方法,并且在若干它从未见过的高难度基准测试上也优于多种SOTA强化学习算法。这一研究结果意义重大,意味着未来实现**AI所需的强化学习算法或许将不再依赖人工设计,而是能够从智能体自身的经验中自动涌现与进化。

河南科技大学2024级硕士研究生武泽龙汇报了论文《A Graph–Tree-Based Scheme for Vulnerability Assessment and High-Risk Path Identification in Industrial Cyber–Physical Systems》文献提出了一种了一种基于图树融合的工业信息物理系统脆弱性评估与高风险路径识别方案,将受拓扑与条件约束的漏洞关联攻击图与 FT/ADT 的安全—安全性概率评估统一到同一方法体系中,实现面向 ICPS 的路径级脆弱性检测。可以在动态物联网网络上实施,以估计利用路径中的漏洞给组织带来的攻击路径成本。提出的方案以新加坡实验室新加坡理工大学网络安全中心iTrust提出的工业水处理厂的SWaT作为ICPS模拟架构进行实验,结果验证了方法的可行性。

(图文/权高原武泽龙 审核/赵可景)