海信申请基于多模态大模型的视频处理专利,实现视频特征的精细化提取

金融界2024年10月18日消息,国家知识产权局信息显示,海信集团控股股份有限公司申请一项名为“基于多模态大模型的视频处理方法、装置、设备及介质”的专利,公开号CN 118779491 A,申请日期为2024年7月。

专利摘要显示,本申请涉及数据处理技术领域,尤其涉及基于多模态大模型的视频处理方法、装置、设备及介质,在本申请实施例中,多模态大模型包括融合结构、语言大模型和至少两个视频编码器,其中,采用至少两个视频编码器提取目标视频的初始视频特征,并采用融合结构将多个视频编码器的初始视频特征进行融合,得到目标视频特征,实现视频的特征的精细化提取,增强多模态大模型视频细节描述能力。

本文源自:金融界

作者:情报员