专家传真-群雄竞逐个人化生成式AI的未来

生成式AI的重点在于生成,能自己产生文字声音和图片,甚至于影片。如果能将重点放在模型的缩小化与节能化,善用现有人手一机的环境,将可以建立以个人手机为中心的个人化生成式AI环境。图/摘自Freepik

报载美国OpenAI执行长奥特曼,积极地与全世界的大金主会谈,希望大家能出资建立一个超大型的高阶晶片生产基地,以支援人工智慧(AI)晶片的发展。预计投资规模将达数兆美元。

同时也有新闻指出,辉达(NVIDIA)已经建立一个新的部门,开始为其他公司设计客制化晶片,以防止日后这些品牌公司自制晶片取代原来辉达的产品。这些品牌公司这么做,是为了要减少开发时程,同时满足自身的特定需求,并节省耗能。

■通用人工智慧将消耗大量算能

OpenAI走的路线是通用人工智慧(AGI),希望让AI拥有和人一样的思考能力,有办法处理视觉,声音和文字与认知。它所采用的方法不是发明新的运算法,而是放大运算规模,包括模型与训练语料的规模。每一个世代,都用数百到数千倍的规模成长。所以才需要有数百数千倍的AI运算能力来支援。因为他们发现,当规模放大到一定程度的时候,AI的认知能力就会出现顿悟的效果。这方法是一个比较偷懒而奢侈的做法,它要用尽现有世间可用资源,以达成目标。目前已经快要达到极限,所以才会再想办法要大家盖更多的IC工厂,以满足需求。

反过来说,如果有人花点钱投资在科学家身上,去发明一个只要用1%大小的规模,就可以达到差不多性能的模型,那不是马上就可减少100倍的AI运算能力的需求吗?但这种投资不知道什么时候才会有结果。比起花钱就确定盖得成的IC工厂,资本家往往选择成果比较能确定的后者。

■运算由机房移向手机

前一阵子,比起OpenAI的ChatGPT相对弱势的Google,也将Google Bard改名为Gemini。Google的Gemini,加强使用中文语料训练,以克服过去完全用英文语料训练,再靠翻译操作所产生的问题。Google推出了Gemini在Android上执行的App,可以识别文字,声音,图像,同时也可以辨认动作。明白地显示,Google的Gemini将要变成和人们随时沟通交谈的超级AI助理,让手机在AI的推论在第一线上扮演更重要的角色。

现在手机的运算能力愈来愈强,许多AI的任务都开始移到手机上执行。手机上常做的影像识别任务,有街景识别,人脸辨识等。手机IC开发公司也常举办AI竞赛,希望能用比较小的模型,达到差不多的效果。如同过去有人利用病毒盗用许多手机上的绘图晶片拿来挖矿一样,将众多手机连结在一起,往往就有如同机房一样的运算能力。这也是过去常在讨论的联邦式学习方式,希望让手机一起合作来训练一个大模型,同时把个人隐私留在自己手机上的小模型中。

用手机就把影像跟声音处理完毕,还有一个好处,就是节省传输频宽。不再需要费时费力地将整个影片传上去处理,只要把重要的资讯抽取后再传出去就可以了,这样大家都轻松方便得多。

■个人化生成式AI的未来

以前要做个人化系统,像个人化新闻,个人化小说,是从你喜欢的类别中挑出现有作品给你。生成式AI(GAI)的重点在于生成,AI能自己产生文字声音和图片,甚至于影片。如果能将重点放在模型的缩小化与节能化,善用现有人手一机的环境,我们将可以建立以个人手机为中心的个人化生成式AI环境。

以后有了个人化生成式AI,将为你量身创作新的新闻,新的小说。你的喜好,你的理想,你对未来的憧憬,都将由你的手机来创作。因为它熟悉你的声音,说话的方式和口气,你做的动作,要建立个人化的作品,将与个人特性贴近许多。不但方便,同时也把你个人的隐私和秘密锁在手机中,只供你一人使用。