中企慧云申请多模态图像分割专利,提高图像分割准确性和掩码产品图像完整性

金融界2024年10月29日消息,国家知识产权局信息显示,北京中企慧云科技有限公司申请一项名为“多模态图像分割方法、装置、电子设备和计算机可读介质”的专利,公开号CN 118823359 A,申请日期为2024年9月。

专利摘要显示,本公开的实施例公开了多模态图像分割方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:将目标产品图像输入至产品图像特征提取网络,得到产品图像特征向量集;将产品图像描述文本信息输入至文本描述特征提取网络,得到产品文本特征向量;对产品图像特征向量集和产品文本特征向量进行多模态特征融合和多尺度特征对齐融合处理,得到多尺度对齐融合特征向量;对多尺度对齐融合特征向量和产品文本特征向量进行特征增强处理,得到跨模态增强特征向量对目标产品图像进行图像分割处理,得到分割掩码产品图像集。该实施方式通过多次多模态融合,充分发挥文本的指导作用,提高图像分割准确性和分割掩码产品图像的完整性。

本文源自:金融界

作者:情报员