☰

百度申请文档图像还原及多模态大模型训练方法和装置专利，可编辑文件还原文档内容

金融界2024年10月29日消息，国家知识产权局信息显示，北京百度网讯科技有限公司申请一项名为“文档图像还原及多模态大模型训练方法和装置”的专利，公开号 CN 118823798 A，申请日期为2024年6月。

专利摘要显示，本公开提供了文档图像还原及多模态大模型训练方法和装置，涉及计算机视觉、深度学习以及大模型等人工智能领域。其中的方法可包括：获取待处理的目标文档图像；将目标文档图像作为多模态大模型的输入，得到输出的第一文件，第一文件为符合预定表示格式的超文本标记语言文件；根据第一文件生成作为还原结果的第二文件，第二文件为可编辑的文件，且第二文件中包括目标文档图像中的文档内容。

本文源自：金融界

作者：情报员

百度申请文档图像还原及多模态大模型训练方法和装置专利，可编辑文件还原文档内容

相关资讯