10月27日,HAUST-HNU大模型与安全联合研究团队第17期组会在线召开。本次组会主题是大语言模型越狱攻击和深度伪造视频检测。会议由河南师范大学荆军昌副教授主持。
河南科技大学2022级硕士研究生岳欣馨汇报了来自《Proceedings of the 41st International Conference on Machine Learning》的关键高水平文献《COLD-Attack: Jailbreaking LLMs with Stealthiness and Controllability》。本次汇报主要分为五个部分,**部分介绍了该文献的背景知识,将现有的越狱方法分为黑盒和白盒越狱,并且回顾了可控文本生成技术。第二部分详细介绍了该文献提出的研究思路,提出可控攻击的约束条件和约束方法。第三部分介绍该文献的方法模型,整合了各种约束方法,实现隐蔽性和流畅性的越狱提示。第四部分总结了该文献的实验结果,表明该攻击在有效性、隐蔽性、高效性方面的优势。第五部分强调得了该方法的安全道德要求,指出LLM面临的潜在威胁和新的挑战,并展望了未来研究方向。
河南科技大学2022级硕士研究生方帅举汇报了来自《IEEE Transactions on Information Forensics and Security》的关键高水平文献《基于人脸凝视特征的深度伪造视频检测》。本次汇报主要分为四个部分,**部分介绍了该文献的背景知识,即目前大部分利用人脸生物信号的DeepFake视频检测器只关注眨眼、嘴唇、微表情等,未考虑人眼凝视特征的影响。第二部分详细介绍了该文献提出的研究思路和方法模型。第三部分介绍该文献的实验过程及结果。第四部分总结了该文献的主要贡献和局限性,并结合自己的研究内容,进一步提出了下阶段研究思路。
河南科技大学2024级博士研究生权高原和潘俊艳分别就参与第七届“大数据安全与隐私计算”学术会议的交流情况进行了汇报。权高原在汇报中详细介绍了方滨兴院士等国内外学者在大数据安全与隐私保护领域的**新研究进展,包括委托计算、网络安全领域的**多位关联认知模型、大模型推理隐私保护等方面的内容。潘俊艳则重点汇报了基于“三个元属性”构建数据安全保护框架、面向端云融合的可信基础设施,以及面向大规模物联网的高鲁棒强安全隐私计算等内容。
在交流环节,与会成员主要针对文献的研究思路、创新点及不明之处展开了热烈的讨论,为下一阶段课题研究提供了新思路。
(图文/岳欣馨、方帅举 审核/权高原)