☰

產業追蹤／衝刺生成式AI 三議題聚焦

AI示意图。路透

生成式AI技术迅速发展，2024年2月，OpenAI在官网上发布48段1分钟长的生成影像，展示最新的文字转影片模型Sora，这个模型不仅可以将文字转换为影片，还可以编辑图片和影像，甚至延展影像时间轴。

新创公司Cognition在今年3月推出虚拟工程师Devin，除了能提供程式编写建议，还能独自完成整个软体或网站开发。这些进展显示，生成式AI技术正逐渐向具有人类智慧行为的「通用AI」发展，预计将引发新一波生成式AI热潮并促进多元应用。

根据CB Insight数据，2023年全球AI投资较2022年下滑10%，然而针对生成式AI新创公司的投资却不减反增，金额达到204亿美元，比前一年增长近六倍。特别是像OpenAI、Anthropic、Hugging Face等独角兽新创公司吸引大量资金，持续带动投资。随着资金和技术逐步到位，生成式AI的发展方向也将从「通用模型」转向「企业专用模型」。

企业发展生成式AI衍生三大需求

为鼓励我国产业投入生成式AI、大语言模型、数位孪生等前瞻技术，经济部产业技术司持续推出多项AI相关计划，如争取免费提供AI超级电脑「Taipei-1」的部分算力给产官学研与新创进行研发使用，并持续推动「领航企业研发深耕计划（大A+计划）」等，支持中小企业与新创导入AI应用，带动积极带动台湾成为全球AI产业生态系的重要伙伴。

在全球生成式AI浪潮下，各行各业都希望引入技术来提高生产力。不论是先进的IT公司、通讯及媒体企业还是传统产业，许多企业已开始尝试将生成式AI应用在各种流程中，以期开发出更高效、符合业务需求的系统。

不过，虽然生成式AI受到广泛关注，但也引发不少担忧，包括资料隐私、透明度、幻觉（误导性资讯）、假讯息、过度信任等风险，因此，国际上也出现「主权AI」的概念，希望透过国家政策发展符合当地社会习惯和文化的大语言模型，进一步推动国家和企业发展。以生成式AI的企业应用而言，仍需留意三大议题，包括「垂直应用资料隐私保护」、「改善大型语言模型幻觉」及「模型客制化方案评估」。

首先，有关「垂直应用资料隐私保护」，生成式AI的基础包括资料、演算法和运算力，其中资料是决定生成式AI推论的重要关键，可以透过在训练过程中使用隐私强化技术来保护企业的机密资料。例如，以真实资料为基础再运用深度学习架构，产生与真实资料相似的「合成资料」；或者在资料中加入杂讯，降低真实资料的机敏部分；也可以共享模型，让多机构间共同训练AI模型的「联合学习」来避免企业机敏资料外泄。

其次为「改善大型语言模型幻觉」，目前生成式AI常见的幻觉，如回答不符合事实或不存在的答案、答非所问、内容逻辑错误等。而幻觉（Hallucination）的产生，是因为受限于历史训练资料，当遇到即时性的问题，容易出现错误资讯。

解决办法之一，是透过「提示微调（Prompt Tuned）」，在不改变模型参数下调整提示，引导特定内容输出，降低幻觉发生机会；另一个方法是「检索增强生成（Retrieval-Augmented Generation, RAG）」，以检索外部资料库，切分提示的单字、语句，再搜寻关键资料生成回答。面对资料即时性高、客制化程度高的问题时，就需要两者相辅相成，持续优化垂直领域的应用需求。

最后则是「模型客制化方案评估」，常见的四种实务做法成本从高到低依次为：投入大量资料和运算力的「从头训练（From Scratch）」、在预训练模型上加入特定资料的「微调（Fine Tuned）」，以及前述的「检索增强生成（RAG）」和「提示微调（Prompt Tuned）」，企业可评估自身需求选择最合适的做法。

（作者是经济部产业技术司ITIS计划团队成员）

產業追蹤／衝刺生成式AI 三議題聚焦

相关资讯