9月20日,CSA多模态情感计算课题组第6期学术组会成功召开,会议由国际联合实验室宋斌老师主持。本次组会的主题是语音情感识别以及基于语音和文本的双模态情感识别。
河南科技大学2024级硕士研究生李晓康以《信号处理》第39卷中的《语音情感识别综述》文献为切入做汇报交流。本次汇报分为四个部分,**部分对语音情感识别的相关方面进行了综合性的介绍,包括语音的情感表示模型、情感语料库和近两年的情感识别方法。第二部分主要介绍了不同的情感表示模型以及优缺点。第三部分对主流的一些情感语料库做了简要的信息概括。第四部分阐述了近两年的语音情感识别方法,包括数据集、模态、特征、验证方法、正确率等方面。**后,描述了语音情感识别仍面临的挑战与展望。
河南科技大学2024级硕士研究生刘文静汇报了论文《基于语音和文本的双模态情感识别综述》。对基于语音和文本的双模态情感识别的研究现状进行了梳理与归纳:首先,介绍了基于语音和文本的双模态情感识别方法,包括特征提取、模态融合和决策分类,重点介绍了4类模态融合方法:特征级融合、决策级融合,模型级融合和多层次融合,分析各方法的不同并给出选择融合方法的依据;此外,总结分析了一系列语音和文本双模态情感识别方法的结果;**后,介绍了情感识别的应用场景、面临的挑战与未来的发展方向。
在交流讨论环节,宋斌老师为汇报做出总结并给予建议,其他与会组员针对汇报内容提出问题并给出自己的见解,各位同学相互学习补足知识空缺。
(图文/李晓康、刘文静 审核/宋斌)