NVIDIA推出两大型语言模型云端AI服务
NeMo LLM服务让开发人员能够在NVIDIA管理的基础设施上,使用被称为快速学习(Prompt Learning)的训练方法,迅速自订调整一些预先训练好的基础模型。NVIDIA Bio NeMo服务是一个云端应用程式介面(API),它将LLM的使用范围扩大到语言之外的科学应用范畴中,以协助制药和生技公司更快开发新药物。
NVIDIA创办人暨执行长黄仁勋表示,LLM具有改变各行各业的潜力。调整基础模型的能力将让数百万名开发人员能够获得LLM强大的力量,无需从头开始建立庞大模型,就能开发语言服务并推动科学发现。
NeMo LLM服务透过快速学习提高准确率并加速部署作业开发人员使用NeMo LLM服务,便能使用自己的训练资料自行调整基础模型,模型大小从30亿个参数到Megatron 530B(这是世界上最大的LLM之一)。跟过去从头开始训练一个模型所需的数周或数个月相比,使用NeMo LLM服务只需几分钟到几小时即可完成。
开发人员使用快速学习来自行调整模型,而快速学习采用一种名为p-tuning的技术。开发人员只需使用几百个范例,就能快速地自行调整基础模型,而过去则要使用数十亿个资料点来进行调整。在客制化的过程中会产生特定任务的提示权杖(token),然后将权杖结合基础模型,为特定使用范例提供更高的准确性与更相关的回应内容。
开发人员可以使用同一个模型对多个使用范例进行客制化调整,并产生出多个不同的提示权杖。Playground功能提供了一个无需编写程式的选项,可以轻松地对模型进行实验及互动操作,进一步提高将LLM用于特定产业使用范例的有效性和可取得性。
准备好部署后,调整好的模型便能在云端执行个体、企业内部系统或透过API运行。
Bio NeMo LLM服务包含两个用于化学和生物学应用的全新Bio NeMo语言模型,可用于支援处理蛋白质、DNA和化学资料,帮助研究人员发现生物序列中的模式并取得宝贵洞察。
Bio NeMo让研究人员能够透过内含数十亿个参数的模型来扩大其研究工作范围。这些更大的模型可以储存更多关于蛋白质结构、基因间进化关系的资讯,甚至可以生成用于治疗的新型生物分子。
云端API让研究人员能够使用Megatron 530B及其他现成模型除了调整基础模型外,LLM服务还能让研究人员透过云端API来使用现成和客制化的模型。
如此一来开发人员便能接触到众多预先完成训练的LLM,包括Megatron 530B,还能接触到透过NVIDIA NeMo Megatron框架所建立的T5和GPT-3模型(该框架现已进入公开测试阶段),以支援广泛的应用程式和多语言服务需求。
汽车、电脑运算、教育、医疗、电信等产业的领导业者正使用NeMo Megatron,为客户提供中文、英文、韩文、瑞典文及其他语言的服务。
NeMo LLM、Bio NeMo服务及云端API预计将于下个月开放抢先试用。开发人员现在可以申请加入,以了解更多细节。
NeMo Megatron框架测试版可透过NVIDIAN GC取得,其经过最佳化调整可在NVIDIA DGX Foundry和NVIDIA DGX SuperPOD,以及Amazon Web Services(AWS)、Microsoft Azure与Oracle Cloud Infrastructure的加速云端执行个体上运行。开发人员可以在NVIDIA LaunchPad实验室中,免费体验NeMo Megatron框架。