百度申请文档图像还原及多模态大模型训练方法和装置专利,可编辑文件还原文档内容
金融界2024年10月29日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“文档图像还原及多模态大模型训练方法和装置”的专利,公开号 CN 118823798 A,申请日期为2024年6月。
专利摘要显示,本公开提供了文档图像还原及多模态大模型训练方法和装置,涉及计算机视觉、深度学习以及大模型等人工智能领域。其中的方法可包括:获取待处理的目标文档图像;将目标文档图像作为多模态大模型的输入,得到输出的第一文件,第一文件为符合预定表示格式的超文本标记语言文件;根据第一文件生成作为还原结果的第二文件,第二文件为可编辑的文件,且第二文件中包括目标文档图像中的文档内容。
本文源自:金融界
作者:情报员
相关资讯
- ▣ 北京大学申请中文医学大语言模型训练方法及装置专利,提高大语言模型在医学领域回答的准确度
- ▣ 百度申请文本检测及文本检测模型训练方法专利,可获得待检测文本的目标粒度的目标检测结果
- ▣ 华为申请图像文件编解码方法专利,提高图像文件压缩率
- ▣ OPPO申请图像编辑方法专利,提高图像编辑效率
- ▣ 威海蓝海银行申请基于多模态融合的文档图像篡改检测方法专利,解决图像篡改检测的技术问题
- ▣ 青岛道可云申请物体模型展示方法及系统专利,能够更真实地还原模型细节
- ▣ 腾讯科技申请一种模型处理方法专利,提高文生图模型的图像生成质量
- ▣ 腾讯公司申请图片生成方法及装置等专利,能够使得文生图模型的应用更加便捷
- ▣ 宁波博登智能科技申请基于多模态大模型的通用图像标注系统及方法专利,标注精度高
- ▣ 百度取得融合文本和自动驾驶数据进行模型训练的方法和车辆专利
- ▣ 南京际舟电子科技申请智能化多模态信息识别与分类管理系统及方法专利,实现多模态文档的准确分类
- ▣ 九章云极申请多模态大模型图像处理专利,提高机器学习模型处理图像的效率
- ▣ 通用文档理解新SOTA,多模态大模型TextMonkey来了
- ▣ 腾讯公司申请模型训练专利,提升模型训练效果
- ▣ 中国铁塔申请算法模型的授权方法及装置专利,实现算法模型的安全授权
- ▣ 智源发布原生多模态世界模型Emu3,实现图像、文本、视频大一统
- ▣ 百度申请图像处理专利,对图像和文本进行高效匹配
- ▣ 东风集团股份申请模型软件的自动化测试方法及装置专利,提高模型软件 MIL 测试效率
- ▣ 书行科技申请图像生成方法及装置相关专利,能准确转换图像风格并保持内容
- ▣ 海信视像申请显示设备、方法及可读存储介质专利,能够更加真实地还原图像
- ▣ 百度申请图像生成等专利,生成包括目标对象的编辑图像
- ▣ 北京火山引擎申请一种文档识别方法专利,极大提升文档识别的准确性
- ▣ 百度在线申请交通大模型训练专利,提高通行时间预测准确度
- ▣ 普强(北京)申请“构建 AI 大模型智能体的方法及装置”专利,提升了 AI 大模型智能体的准确率
- ▣ 浪潮云申请针对 AI 大模型的模型数据录入专利,提高模型训练效率和准确性
- ▣ 贝壳找房申请应用程序模型数据加载方法及装置专利,提高了模型数据的加载速度及应用程序的启动速度
- ▣ 奇瑞申请白车身模态识别分析方法和装置专利,提高模态识别分析效率且不易出错
- ▣ 中国移动通信申请文件编译方法专利,实现业务应用源文件编译处理
- ▣ 国科微申请一种算法模型子图划分相关专利,能够灵活平衡编译速度和编译后模型运行效率