產業追蹤/衝刺生成式AI 三議題聚焦
AI示意图。 路透
生成式AI技术迅速发展,2024年2月,OpenAI在官网上发布48段1分钟长的生成影像,展示最新的文字转影片模型Sora,这个模型不仅可以将文字转换为影片,还可以编辑图片和影像,甚至延展影像时间轴。
新创公司Cognition在今年3月推出虚拟工程师Devin,除了能提供程式编写建议,还能独自完成整个软体或网站开发。这些进展显示,生成式AI技术正逐渐向具有人类智慧行为的「通用AI」发展,预计将引发新一波生成式AI热潮并促进多元应用。
根据CB Insight数据,2023年全球AI投资较2022年下滑10%,然而针对生成式AI新创公司的投资却不减反增,金额达到204亿美元,比前一年增长近六倍。特别是像OpenAI、Anthropic、Hugging Face等独角兽新创公司吸引大量资金,持续带动投资。随着资金和技术逐步到位,生成式AI的发展方向也将从「通用模型」转向「企业专用模型」。
企业发展生成式AI衍生三大需求
为鼓励我国产业投入生成式AI、大语言模型、数位孪生等前瞻技术,经济部产业技术司持续推出多项AI相关计划,如争取免费提供AI超级电脑「Taipei-1」的部分算力给产官学研与新创进行研发使用,并持续推动「领航企业研发深耕计划(大A+计划)」等,支持中小企业与新创导入AI应用,带动积极带动台湾成为全球AI产业生态系的重要伙伴。
在全球生成式AI浪潮下,各行各业都希望引入技术来提高生产力。不论是先进的IT公司、通讯及媒体企业还是传统产业,许多企业已开始尝试将生成式AI应用在各种流程中,以期开发出更高效、符合业务需求的系统。
不过,虽然生成式AI受到广泛关注,但也引发不少担忧,包括资料隐私、透明度、幻觉(误导性资讯)、假讯息、过度信任等风险,因此,国际上也出现「主权AI」的概念,希望透过国家政策发展符合当地社会习惯和文化的大语言模型,进一步推动国家和企业发展。以生成式AI的企业应用而言,仍需留意三大议题,包括「垂直应用资料隐私保护」、「改善大型语言模型幻觉」及「模型客制化方案评估」。
首先,有关「垂直应用资料隐私保护」,生成式AI的基础包括资料、演算法和运算力,其中资料是决定生成式AI推论的重要关键,可以透过在训练过程中使用隐私强化技术来保护企业的机密资料。例如,以真实资料为基础再运用深度学习架构,产生与真实资料相似的「合成资料」;或者在资料中加入杂讯,降低真实资料的机敏部分;也可以共享模型,让多机构间共同训练AI模型的「联合学习」来避免企业机敏资料外泄。
其次为「改善大型语言模型幻觉」,目前生成式AI常见的幻觉,如回答不符合事实或不存在的答案、答非所问、内容逻辑错误等。而幻觉(Hallucination)的产生,是因为受限于历史训练资料,当遇到即时性的问题,容易出现错误资讯。
解决办法之一,是透过「提示微调(Prompt Tuned)」,在不改变模型参数下调整提示,引导特定内容输出,降低幻觉发生机会;另一个方法是「检索增强生成(Retrieval-Augmented Generation, RAG)」,以检索外部资料库,切分提示的单字、语句,再搜寻关键资料生成回答。面对资料即时性高、客制化程度高的问题时,就需要两者相辅相成,持续优化垂直领域的应用需求。
最后则是「模型客制化方案评估」,常见的四种实务做法成本从高到低依次为:投入大量资料和运算力的「从头训练(From Scratch)」、在预训练模型上加入特定资料的「微调(Fine Tuned)」,以及前述的「检索增强生成(RAG)」和「提示微调(Prompt Tuned)」,企业可评估自身需求选择最合适的做法。
(作者是经济部产业技术司ITIS计划团队成员)