南方智媒申请基于人工智能技术的媒体多模态内容审核方法及系统专利,能够高效、准确地检测和识别违规内容
金融界2024年12月5日消息,国家知识产权局信息显示,广东南方智媒科技有限公司申请一项名为“基于人工智能技术的媒体多模态内容审核方法及系统”的专利,公开号CN 119068399 A,申请日期为2024年11月。
专利摘要显示,本发明涉及一种基于人工智能技术的媒体多模态内容审核方法及系统,包括接收待审核媒体内容并判断媒体类型,当判断媒体内容为视频时,将音频与视频分离,并采用基于梯度变化检测的算法抽取视频的关键帧;采用目标检测模型对视频的关键帧进行目标检测,采用人脸识别模型对视频的关键帧进行人脸识别,以及采用语音识别模型对音频进行转文本处理;基于目标检测结果、人脸识别结果和转文本处理结果,通过预设的违规信息库和自然语言处理算法,分析违规信息并输出审核结果。本发明通过结合目标检测、人脸识别和语音识别技术,实现对不同媒体内容的全面分析,能够高效、准确地检测和识别违规内容,提升审核效率和准确性,适用于多种媒体内容审核场景。
本文源自:金融界
作者:情报员