百度申请文档图像还原及多模态大模型训练方法和装置专利,可编辑文件还原文档内容

金融界2024年10月29日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“文档图像还原及多模态大模型训练方法和装置”的专利,公开号 CN 118823798 A,申请日期为2024年6月。

专利摘要显示,本公开提供了文档图像还原及多模态大模型训练方法和装置,涉及计算机视觉、深度学习以及大模型等人工智能领域。其中的方法可包括:获取待处理的目标文档图像;将目标文档图像作为多模态大模型的输入,得到输出的第一文件,第一文件为符合预定表示格式的超文本标记语言文件;根据第一文件生成作为还原结果的第二文件,第二文件为可编辑的文件,且第二文件中包括目标文档图像中的文档内容。

本文源自:金融界

作者:情报员