瞭望 | 发展AI大模型重在落地

文 | 扈永顺

“为什么ChatGPT越来越强,而我们在百模大战?”在近日召开的2024世界人工智能大会上,有参会专家对我国AI大模型抛出尖锐提问。

自2023年ChatGPT引发生成式AI热潮以来,国内包括百度、华为、阿里巴巴等众多科技巨头投入大模型研发,一些独角兽企业、高校院所也纷纷加入大模型开发队伍。据统计,截至今年5月,国内已经推出超过300个大模型。10亿参数规模以上的大模型在今年3月也已经超过100个。

我国大模型数量虽多,但盈利模式尚不清晰,落地应用仍待破局。数据显示,日活千万的通用大模型一年需超过100亿元的收入才能支撑其背后的数据中心成本。

发展AI大模型重在落地。加速大模型落地,需要进一步明晰应用场景和需求。现在看,发展面向行业的模型,将通用大模型的底层技术与特定行业的专业知识和数据相结合,可以解决特定领域的复杂问题和挑战,有助于大模型落地。比如教育、金融、医疗等行业,因具有丰富数据、对AI技术接受度高等特点,可能是大模型落地的关键领域。

推动大模型落地,还需要解决数据质量与隐私等难题。高质量、多样化的数据是大模型训练的基础,当前企业在获得数据时面临数据质量不高、数据分布不均或数据集不完整等困难,影响模型的训练效果和泛化能力。同时,保护数据隐私和安全也需要足够重视,要确保在使用包含个人信息的数据前进行脱敏处理,以去除或模糊可以识别个体的信息。

AI大模型正面临从云端到地面的关键一跃。面对未来,我们要保持开放的心态和创新的精神,不断探索AI大模型的应用潜力,让科技之光更好照亮人类的前行道路。■