长江证券:OpenAI揭秘“草莓”AI Meta(META.US)多模态新技术重磅落地

智通财经APP获悉,长江证券发布研报称,OpenAI计划最早在今年秋天推出代号为“草莓”的新人工智能,该人工智能旨在改进即将推出的“Orion(猎户座)”,以帮助OpenAI减少模型生成的错误数量,提高答案的准确性。Meta(META.US)最近发布了融合Transformer和Diffusion的训练能够生成文本和图像模型的统一方法Transfusion,该方法有望用于训练真正的多模态模型。AI技术关卡持续突破,用户体验逐步提升。OpenAI和Meta等头部企业对AI技术的突破以及应用拓展将会带领全行业技术创新和用户体验的提升,AI行业拥有广阔的发展前景。

OpenAI计划推出代号为“草莓”的新人工智能。1)AI大模型技术更新推动演算能力提高。“草莓”具备解决以前从未见过的数学问题的能力,这是当今的聊天机器人所无法准确做到的。给予长时间演算时,“草莓”还能够回答用户更主观的问题,适用于对时间不太敏感的用例。2)训练数据生成能力增强。“草莓”旨在改进即将推出的“Orion(猎户座)”,可以帮助OpenAI克服获取足够高质量数据的限制,以便利用现实世界的数据训练新模型,并帮助OpenAI减少模型生成的错误数量,提高答案的准确性。“草莓”的推理能力有望被整合进ChatGPT,同时,该技术还将对未来能够完成多步骤任务的智能体产品产生深远影响。

Meta多模态模型训练方法取得新进展,全新视觉模型性能出色。1)高性能图像与文本生成能力。Transfusion能够生成与相似规模的扩散模型相媲美的高质量图像,而且,它同时也保持了强大的文本生成能力。在GenEval基准上,Transfusion模型优于DALL-E2和SDXL等其他流行模型,且在文本基准上达到了Llama1级别的性能水平。该方法使用前景十分广阔,有望用于训练真正的多模态模型。2)Sapiens优化视觉任务。Meta推出的全新视觉模型Sapiens对二维姿势预估、身体部位分割、深度估计和表面法线预测四大关键视觉认为进行了优化,在多种场景均有用武之地。3)泛化能力卓越,用户使用便利。Sapiens模型易于针对个别任务进行调整,面对真实世界数据时表现出卓越的泛化能力。即便是在标注数据稀缺或完全使用合成数据的情况下,Sapiens依然拥有出色的性能。此外,该模型易用性强,为具有不同训练设置偏好的用户提供了多样化的安装路径选择。

AI技术关卡持续突破,用户体验逐步提升。OpenAI和Meta等头部企业对AI技术的突破以及应用拓展将会带领全行业技术创新和用户体验的提升,AI行业拥有广阔的发展前景。AI技术及应用领域持续突破,建议持续关注AI在视觉成像和内容创作等各领域的商业化落地。

风险提示

1、AI技术发展不及预期风险;

2、内容监管风险。

本文源自:智通财经网