☰

NVIDIA公布名為LATTE3D的研究技術透過文字描述即可快速生成完整3D模型

NVIDIA在此次GTC 2024期间公布名为LATTE3D的3D模型自动生成技术，让使用者能直接透过自然语言文字描述，即可产生完整的3D模型。

此研究是由NVIDIA位于多伦多的AI实验室团队提出技术，透过自动生成式人工智慧，配合文字描述即可创建可用于虚拟视觉环境的3D模型，借此加速电玩游戏、广告活动、设计项目，或是用于建构机器人虚拟训练场域。

过去已经有类似技术提出，但往往需要1小时或更久时间进行渲染，但当前技术仅需10到12秒即可生成，同时也能产生品质更高的模型内容。

此外，相较过往需要更高显示加速运算效能才能达成相同成果，目前的技术仅需透过单张NVIDIA RTX A6000专业绘图卡，即可在极短时间内生成3D模型，让使用者能随时透过文字命令方式产生内容，借此加速内容创作或机器学习训练建置时间。

目前NVIDIA主要针对动物及日常物体两大类型进行密集训练，并且让生成内容能以通用场景描述 (OpenUSD)格式应用在诸如Omniverse平台等环境使用，而开发人员也能针对生成需求训练不同类型内容。

至于LATTE3D是透过NVIDIA A100加速运算元件完成训练，同时也搭配使用ChatGPT生成文字提示进行训练，借此让模型更容易理解使用者以文字输入时所代表意涵，避免在生成过程产生误判。

除了分享LATTE3D技术应用，NVIDIA研究团队也强调本身投入各方面领域研究，借此在软体技术、半导体电路、储存、材料、人工智慧模型等领域探索公司未来可能发展机会，以及未来产品技术突破可能性，而研究团队目前则是位于北美、台湾等全球地区。

《原文刊登于合作媒体mashdigi，联合新闻网获授权转载。》

NVIDIA公布名為LATTE3D的研究技術 透過文字描述即可快速生成完整3D模型