NVIDIA公布名為LATTE3D的研究技術 透過文字描述即可快速生成完整3D模型

NVIDIA在此次GTC 2024期间公布名为LATTE3D的3D模型自动生成技术,让使用者能直接透过自然语言文字描述,即可产生完整的3D模型。

此研究是由NVIDIA位于多伦多的AI实验室团队提出技术,透过自动生成式人工智慧,配合文字描述即可创建可用于虚拟视觉环境的3D模型,借此加速电玩游戏、广告活动、设计项目,或是用于建构机器人虚拟训练场域。

过去已经有类似技术提出,但往往需要1小时或更久时间进行渲染,但当前技术仅需10到12秒即可生成,同时也能产生品质更高的模型内容。

此外,相较过往需要更高显示加速运算效能才能达成相同成果,目前的技术仅需透过单张NVIDIA RTX A6000专业绘图卡,即可在极短时间内生成3D模型,让使用者能随时透过文字命令方式产生内容,借此加速内容创作或机器学习训练建置时间。

目前NVIDIA主要针对动物及日常物体两大类型进行密集训练,并且让生成内容能以通用场景描述 (OpenUSD)格式应用在诸如Omniverse平台等环境使用,而开发人员也能针对生成需求训练不同类型内容。

至于LATTE3D是透过NVIDIA A100加速运算元件完成训练,同时也搭配使用ChatGPT生成文字提示进行训练,借此让模型更容易理解使用者以文字输入时所代表意涵,避免在生成过程产生误判。

除了分享LATTE3D技术应用,NVIDIA研究团队也强调本身投入各方面领域研究,借此在软体技术、半导体电路、储存、材料、人工智慧模型等领域探索公司未来可能发展机会,以及未来产品技术突破可能性,而研究团队目前则是位于北美、台湾等全球地区。

《原文刊登于合作媒体mashdigi,联合新闻网获授权转载。》