扬州万方申请一种搭载于无人机的多模态场景内容理解系统专利,能够在单模态信息不足时依然能输出鲁棒的结论
金融界2024年11月4日消息,国家知识产权局信息显示,扬州万方科技股份有限公司申请一项名为“一种搭载于无人机的多模态场景内容理解系统”的专利,公开号CN 118887590 A,申请日期为2024年8月。
专利摘要显示,一种搭载于无人机的多模态场景内容理解系统,涉及深度学习和多模态内容理解领域。包括依次连接的信号采集单元、数据采样和处理单元、时空特征提取单元、双模态特征融合单元和场景内容分类单元,所述信号采集单元用于对音频数据和视频数据进行采集;所述数据采样和处理单元用于对音频数据进行处理形成频谱图以及对视频数据进行帧采样所述时空特征提取单元用于对音频模态的连续频谱图提取特征以及对视频模态的连续帧提取时空特征;整个系统结合音频和视频完成场景内容的理解,相比于单模态或者单帧加逻辑的系统设计,本发明能够在单模态信息不足时依然能输出鲁棒的结论,并且凭借其帧间变化和动作特征提取能力可以理解更多动态场景内容类型。
本文源自:金融界
作者:情报员