百度申请图像处理专利,对图像和文本进行高效匹配

金融界2024年10月31日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“图像处理方法、装置、电子设备和存储介质”的专利,公开号 CN 118840452 A,申请日期为2024年7月。

专利摘要显示,本公开提供了一种图像处理方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及图像处理领域和大模型领域。具体实现方案为:对第一图像中各个文本区域进行文本识别,得到多个目标对象名称文本段和各个目标对象名称文本段在第一图像中的位置信息;基于多个目标对象名称文本段,确定名称类别;基于名称类别,对第一图像中各个目标对象图像区域进行分割,得到多个目标对象图像以及各个目标对象图像中目标对象在第一图像中的位置信息;基于各个目标对象名称文本段在第一图像中的位置信息,以及各个目标对象图像中目标对象在第一图像中的位置信息,对多个目标对象名称文本段与多个目标对象图像进行一一匹配,得到多个文本段与图像组合。

本文源自:金融界

作者:情报员