敏感信息多模态检测
目前,在线社交网络用户发布的信息正在指数级增长,并呈现格式和内容多样化、多模态等特点,大量含有涉黄、涉政、涉恐的敏感信息充斥在互联网中,致使敏感信息检测的难度不断增大。为有效控制社交网络敏感信息的发布和传播,营造风清气正的互联网环境,研究提出了基于深度学习的多模态融合敏感信息检测方法。
1. 基于细粒度情感的文本敏感分类检测方法
针对传统的关键字匹配方法准确率低、检测速度慢等问题,设计了结合语义分析的快速敏感信息检测方法。该方法中敏感词库包含大量敏感词,在使用过程中用户也可根据需要进行敏感词的增删改查等操作。利用fastText快速文本处理方法,结合敏感词库和语义分析对文本进行敏感性检测,在进行文本敏感性判定的同时,引入情感极性因子,提出一种基于情感词和敏感词共现分析的敏感信息检测方法。
2. 多模态融合敏感分类检测方法
针对传统敏感图像检测的二分类问题,设计了敏感图像分类检测模型,将图像分为三类:涉黄、涉政、涉恐。为了解决单模态文本或图片的敏感信息检测方法不能充分挖掘社交网络敏感信息内容的问题,提出一种图文融合多模态敏感信息检测方法,采用决策层融合策略,根据概率分配和相关阈值的设定,进行图片和文本的融合分类。
3. 敏感信息检测技术在多媒体社交网络平台中的应用
本项目提出的基于深度学习的多模态融合敏感信息检测方法能够及时并准确地检测出多媒体社交网络平台中的用户发布的敏感帖子内容。
涉黄类数据
涉政类数据
涉恐类数据
图文单模态与图文融合多模态敏感分类结果对比
[ IEEE / IEEE_ComSoc / IEEE_MMTC ] [ IEEE MMTC Publications ] [ IEEE MMTC Awards ] [ IEEE MMTC Conferences ] [ IEEE MMTC Frontiers ] [ IEEE MMTC IGs ]
[ IEEE Computer Society ] [ IEEE Signal Processing Society ] [ IEEE Consumer Electronics Societ ] [ IEEE Systems, Man, and Cybernetics Society ]
© Copyright 2018-2021 HNCSA@HAUST - All rights reserved. China ICP Registration Granted No. 豫ICP备11003260号-1.
A not-for-profit organization, IEEE is the world's largest professional association for the advancement of technology.
HNCSA@HAUST is sponsored by Henan International Joint Laboratory of Cyberspace Security Applications, Henan University of Science and Technology and Special Interest Group on Digital Rights Management (SIGDRM), EST. 2006.