百度申请图像生成等专利,生成包括目标对象的编辑图像
金融界2024年10月29日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“图像生成、大模型的训练、图像处理方法及装置、设备和介质”的专利,公开号 CN 118823184 A,申请日期为 2024 年 6 月。
专利摘要显示,本公开提供了一种图像生成、大模型的训练、图像处理方法及装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC、人机交互等场景。该图像生成方法包括:获取编辑文本和经加噪处理的原始图像,编辑文本用于指示针对目标对象的编辑操作,经加噪处理的原始图像未包括目标对象;分别对编辑文本和经加噪处理的原始图像进行特征提取处理,得到文本特征和图像特征,文本特征包括至少一个词向量;根据文本特征和图像特征,确定至少一个词向量各自的特征图;根据至少一个词向量各自的特征图,生成编辑图像,编辑图像包括目标对象。
本文源自:金融界
作者:情报员