☰

专家传真－群雄竞逐个人化生成式AI的未来

生成式AI的重点在于生成，能自己产生文字声音和图片，甚至于影片。如果能将重点放在模型的缩小化与节能化，善用现有人手一机的环境，将可以建立以个人手机为中心的个人化生成式AI环境。图／摘自Freepik

报载美国OpenAI执行长奥特曼，积极地与全世界的大金主会谈，希望大家能出资建立一个超大型的高阶晶片生产基地，以支援人工智慧（AI）晶片的发展。预计投资规模将达数兆美元。

同时也有新闻指出，辉达（NVIDIA）已经建立一个新的部门，开始为其他公司设计客制化晶片，以防止日后这些品牌公司自制晶片取代原来辉达的产品。这些品牌公司这么做，是为了要减少开发时程，同时满足自身的特定需求，并节省耗能。

■通用人工智慧将消耗大量算能

OpenAI走的路线是通用人工智慧（AGI），希望让AI拥有和人一样的思考能力，有办法处理视觉，声音和文字与认知。它所采用的方法不是发明新的运算法，而是放大运算规模，包括模型与训练语料的规模。每一个世代，都用数百到数千倍的规模成长。所以才需要有数百数千倍的AI运算能力来支援。因为他们发现，当规模放大到一定程度的时候，AI的认知能力就会出现顿悟的效果。这方法是一个比较偷懒而奢侈的做法，它要用尽现有世间可用资源，以达成目标。目前已经快要达到极限，所以才会再想办法要大家盖更多的IC工厂，以满足需求。

反过来说，如果有人花点钱投资在科学家身上，去发明一个只要用1％大小的规模，就可以达到差不多性能的模型，那不是马上就可减少100倍的AI运算能力的需求吗？但这种投资不知道什么时候才会有结果。比起花钱就确定盖得成的IC工厂，资本家往往选择成果比较能确定的后者。

■运算由机房移向手机

前一阵子，比起OpenAI的ChatGPT相对弱势的Google，也将Google Bard改名为Gemini。Google的Gemini，加强使用中文语料训练，以克服过去完全用英文语料训练，再靠翻译操作所产生的问题。Google推出了Gemini在Android上执行的App，可以识别文字，声音，图像，同时也可以辨认动作。明白地显示，Google的Gemini将要变成和人们随时沟通交谈的超级AI助理，让手机在AI的推论在第一线上扮演更重要的角色。

现在手机的运算能力愈来愈强，许多AI的任务都开始移到手机上执行。手机上常做的影像识别任务，有街景识别，人脸辨识等。手机IC开发公司也常举办AI竞赛，希望能用比较小的模型，达到差不多的效果。如同过去有人利用病毒盗用许多手机上的绘图晶片拿来挖矿一样，将众多手机连结在一起，往往就有如同机房一样的运算能力。这也是过去常在讨论的联邦式学习方式，希望让手机一起合作来训练一个大模型，同时把个人隐私留在自己手机上的小模型中。

用手机就把影像跟声音处理完毕，还有一个好处，就是节省传输频宽。不再需要费时费力地将整个影片传上去处理，只要把重要的资讯抽取后再传出去就可以了，这样大家都轻松方便得多。

■个人化生成式AI的未来

以前要做个人化系统，像个人化新闻，个人化小说，是从你喜欢的类别中挑出现有作品给你。生成式AI（GAI）的重点在于生成，AI能自己产生文字声音和图片，甚至于影片。如果能将重点放在模型的缩小化与节能化，善用现有人手一机的环境，我们将可以建立以个人手机为中心的个人化生成式AI环境。

以后有了个人化生成式AI，将为你量身创作新的新闻，新的小说。你的喜好，你的理想，你对未来的憧憬，都将由你的手机来创作。因为它熟悉你的声音，说话的方式和口气，你做的动作，要建立个人化的作品，将与个人特性贴近许多。不但方便，同时也把你个人的隐私和秘密锁在手机中，只供你一人使用。

专家传真－群雄竞逐个人化生成式AI的未来

相关资讯