NVIDIA更新ChatRTX功能 支援Gemma等AI模型、新增影像識別能力

NVIDIA在今年2月时展示可在装置端独立运作的「Chat With RTX」聊天机器人,目前加入更多新功能,并且支援最新人工智慧模型,而此次更新也在DLSS 3.5加入包含光线重建技术,并且将强化NVIDIA RTX Remix中包含光线追踪效果模组的表现。

「Chat With RTX」目前以ChatRTX为称,可利用检索增强生成、NVIDIA TensorRT-LLM,以及NVIDIA RTX加速等技术,让聊天机器人能在Windows PC和工作站以大型自然语言模型运作,并且透过自然语言方式与人互动。

新版ChatRTX则加入支援Google近期开放的大型自然语言模型Gemma,另外也支援基于通用语言模型框架的开放式中英双语ChatGLM3大型自然语言模型。

由于支援OpenAI的对比语言和影像预训练(Contrastive Language-Image Pre-training,CLIP)技术,使用者还能透过ChatRTX与影像资料进行互动,并且透过训练和细化后的CLIP神经网络,进而在自然语言监督中学习视觉概念,意味此模型将可辨识在影像集里「看到」的东西,让使用者可透过单字、术语和短语,与装置本机端的相片和影像进行互动,无需使用复杂的诠释资料标记。

新版ChatRTX更可让使用者以用自己的声音与资料进行聊天,主要在于导入支援使用人工智慧处理口语资料的自动语音识别系统Whisper,让使用者可以在应用程式上用语音进行查询,并糗且由ChatRTX以文字回应。

而在新版RTX Remix中,使用者将能借此将经典PC游戏「重建」为支援NVIDIA RTX技术的游戏作品,并且对应DLSS 3.5技术功能,借此诠释更真实的即时光影追迹效果,另外也能透过自动生成式人工智慧分析经典游戏中的低解析度贴图纹理,进而生成更符合真实物理场景材质、并且将解析度提升4倍,借此减少模组改装者原本必须花费长时间调整的情形。

《原文刊登于合作媒体mashdigi,联合新闻网获授权转载。》