中关村得助大模型平台2.0发布:算力统一调度、5分钟构建应用

智东西作者 汪越编辑 漠影

智东西12月12日报道,今天下午,2024大模型技术与应用创新论坛在京顺利举办。论坛现场,中关村科金总裁喻友平正式发布中关村科金大模型时代的“三级引擎战略”,并推出得助大模型平台 2.0 ,以及一系列大模型应用。

据喻友平介绍,基于得助大模型平台2.0,中关村科金已与各行业伙伴一起构建了200+覆盖智能营销、智能客服、智能运营和知识管理四大核心场景的应用。

此外,中国工程院院士、清华大学计算机系教授郑纬民院士分享了国产计算系统面临的两大技术瓶颈:构建国产万卡系统的重大挑战,以及异构卡和异地卡联合训练效果不佳。

ChatGPT核心研发科学家、前OpenAI研究员、全球顶级人工智能科学家肯尼斯·斯坦利(Kenneth Stanley)谈道,随着Scaling Law效应的减弱,未来人工智能的发展将不再依赖简单的扩展,而是需要全新的架构和理念。

中国信通院人工智能研究所平台与工程化部主任曹峰称,通过优化Agent的工作流,即使在大模型能力达到上限时,也能进一步提升任务的准确性和输出质量。

一、中关村科金发布大模型平台2.0,构建200+核心场景应用

在论坛的核心发布环节,中关村科金总裁喻友平介绍了该公司针对大模型时代的企业智能化升级战略,并发布了得助大模型平台2.0。该平台旨在为企业提供一个全面支持大模型应用的生态系统,推动智能化转型。

得助大模型平台2.0采用的“三级引擎战略”包括平台、应用和服务三个核心组成部分,旨在为企业提供从算力调度到应用落地的完整解决方案。

得助大模型平台2.0具备以下核心功能:

1、算力统一调度:支持GPU算力共享和模型的统一管理,提升资源利用率和部署效率。

2、一站式模型训推服务:兼容所有开源模型及开放的MaaS平台,为用户提供从模型训练到推理部署的全流程支持。

3、快速应用构建:通过多样化的组件选择,包括逻辑组件、通用组件、场景组件等,支持客户在5到10分钟内构建符合需求的应用。

4、高效的RAG技术:针对复杂版式训练优化,确保高达98%以上的识别准确率。

目前,得助大模型平台2.0已在多个行业中得到应用。中关村科金与行业合作伙伴共同构建了超过200个大模型应用,涵盖智能营销、智能客服、智能运营和知识管理等核心领域。

例如,一家装平台利用大模型外呼技术,在活动营销中实现了3.5%的转化率,相比传统AI外呼提升了130%;另外,联合多个省市公安机关推出的大模型接警助手,将反诈接警全流程的周期从30分钟缩短至2分钟。

二、清华大学郑纬民:国产万卡系统构建艰难,异构卡联合训练效果不佳

在人工智能进入大模型时代的过程中,清华大学计算机系教授、中国工程院院士郑纬民分享了人工智能发展的两大趋势:一是 AI 基础大模型从单模态向多模态发展,二是大模型加速行业智能化升级。

郑纬民院士谈道,随着大模型技术的成熟,将会有三类企业脱颖而出:一是研发大模型的企业,二是推动大模型应用落地的企业,三是提供支持大模型计算系统的企业。中关村科金作为应用落地的典型代表,在这一过程中扮演了重要角色。

当前外部因素如英伟达对中国高性能芯片的限制,促使中国加速建设本地化计算系统,特别是在数据实地化、内容主题化和算力国产化方面取得了进展。然而,国产硬件的生态环境仍不完善,导致许多企业不愿意采纳,这成为了制约人工智能进一步发展的关键因素。郑纬民院士说:“优秀的系统软件才能充分发挥底层硬件的算力潜力,当前我们必须着力打造10个核心软件。”

郑纬民院士还讨论了构建国产万卡系统的困难。“尽管建设国产万卡系统至关重要,但目前面临的技术难题相当复杂,尤其是在多厂商异构硬件组合使用时,往往会导致性能急剧下降,甚至使用新一代与旧一代 CPU 混合时,整体性能会低于仅使用旧一代 CPU 的情况。”这一现象也被形容为“木桶效应”,即系统性能受到最弱环节的限制。

在谈到异构卡联合训练时,郑纬民院士说,目前这一技术在跨地理位置数据中心(异地卡)训练中面临的挑战。由于高延迟问题,异地卡联合训练的效果远低于预期。因此,郑院士建议,在成本效益尚不明确的情况下,短期内应避免过度依赖这一方案。

三、前OpenAI研究员斯坦利:AI突破需新架构,幻觉非创造力

ChatGPT核心研发科学家、前OpenAI研究员、全球顶级人工智能科学家肯尼斯·斯坦利(Kenneth Stanley)谈道,随着Scaling Law效应逐渐减弱,传统的“更多数据、更多计算”的策略可能不再奏效,人工智能的发展将不再依赖于简单的扩展,而是需要新的架构和理念来突破现有局限。

在自然语言处理(NLP)领域,斯坦利认为当前广泛应用的Transformer架构已经接近瓶颈。虽然Transformer已经极大地推动了AI的发展,但为了实现超越人类智能(AGI),现有的架构可能无法提供足够的支持。

因此,未来可能需要对现有架构进行根本性修改,或者开发全新的架构,以便捕捉那些现有模型无法处理的智能特征,特别是涉及时间演化和创新性判断的复杂过程。

斯坦利说,AI当前表现出的“幻觉”并不等同于创造力。他提出了“创造性错觉”的概念,认为AI的“新想法”通常只是对训练数据的再现,而非真正的创新。当前技术无法有效区分已知与未知,解决幻觉问题是实现真正创新的关键。

关于如何应对大模型幻觉问题,斯坦利谈道,OpenAI和中关村科金的实践经验值得借鉴。OpenAI通过扩大模型参数规模和强化学习提升推理能力;中关村科金结合高质量的领域知识和数据,开发了更为专业的领域大模型应用。这些方法有效减少了大模型的幻觉问题,并推动了模型在实际应用中的表现提升。

在多模态技术方面,斯坦利说,虽然GPT-4o等多模态模型在图像和视频处理上取得了进展,但这种进步并未带来智能本质的飞跃。多模态技术并不是通向AGI的唯一途径。要实现人类水平的智能,推理能力、创新性和复杂信息处理等因素可能更为关键。

四、信通院曹峰:优化Agent工作流,提升任务准确性

中国信通院人工智能研究所平台与工程化部主任曹峰分享了对AI Agent技术的应用思考。

在Agent的能力方面,曹峰说,Agent不仅需要具备多模态感知和多任务决策的能力,还必须能够在少量样本的情况下进行快速泛化。这使得Agent能够在不同场景中有效工作,尤其是在数据稀缺的情况下仍能做出精准的判断和决策。

他还谈道,优化Agent的工作流是提升大模型应用性能的重要途径。例如,通过在代码开发场景中优化Agent工作流,准确率从40%提升到90%以上,证明了合理设计工作流能够在模型能力达到上限时,进一步提升任务准确性和输出质量。

关于未来发展,曹峰提出了大模型与小模型结合应用的前景。在这一组合模式中,大模型负责复杂任务的规划与拆解,小模型专注于执行具体任务。通过这种方式,不仅能降低整体成本,还能提升系统的性能与可解释性。

Agent的泛化性和鲁棒性仍然是当前的技术瓶颈。如何增强Agent对新环境的适应能力和在多变条件下的稳定性,将是未来研究的重要方向。

此外,Agent之间的互操作性也带来了数据安全与责任归属的问题。如何确保Agent的安全使用,并明确责任归属,将是行业广泛应用Agent技术的关键所在。

最后,曹峰谈道,大模型的应用正在从单一的对话接口,逐渐扩展到包含知识库、智能调优、微调能力、以及多Agent协作等高级功能的综合服务形态。这种多极服务模式标志着大模型应用的深度与广度正在不断增加,未来将呈现出更多创新的应用场景。

结语:得助大模型平台2.0推动企业智能化转型

得助大模型平台2.0的发布,不仅提供了从算力调度到应用部署的全链条解决方案,也回应了行业对实际可用、可持续大模型平台的需求。

然而,技术的突破不止于此,如何在大模型时代,打破当前技术瓶颈,仍需依赖架构创新和不断的实际应用积累。