亏损线上论坛变AI概念股 美版PTT为何一上市暴涨48%

(来源:Dreamstime/典匠影像)

一个匿名线上论坛,成立近二十年来仍年年亏损,为何能一夕摇身变成「AI概念股」,股价还在上市首日大涨四八%?这个主角,是有「美国版PTT」之称的Reddit。

做为美国最大线上论坛的Reddit,是海外乡民集散地、迷因哏发源地,更是许多时事的风向球。它的前三大股东,不只包含美国媒体集团康泰纳仕(Condé Nast)、中国网路巨头腾讯,更有现在最火热的AI公司OpenAI执行长山姆・奥特曼(Sam Altman)。

三月二十一日,它以每股三十四美元的价格,正式在纽约证交所挂牌上市,在上市十天后,股价仍高于挂牌价约四五%。

可能不少人还记得二○二一年的「游戏驿站(GameStop)之乱」——正是Reddit上聚集的散户,狂买被对冲基金看空的股票,在二十天内硬是把这支股票的价格,推升成长近二十倍。

过去变现力低,受TikTok挑战

二○○五年成立的Reddit,由毕业于美国维吉尼亚大学的史蒂夫.霍夫曼(Steve Huffman)与亚历克西斯.瓦尼安(Alexis Ohanian)共同创立,如今它的网站流量排名全美前十大,略低于维基百科、胜过LinkedIn,每天有超过七千三百万名活跃用户;旗下子论坛(subreddits)更超过十万个,话题从政治到金融、从科学到迷因都有,甚至,还有「请把我当五岁小孩解释给我听(Explain Like I'm Five)」这样难以归类的主题。其流量在二○一八年甚至一度超越脸书,跃升仅次于Google和YouTube的全美第三大网站。

有趣的是,它虽然是上一个网路世代的产物,但用户样貌却相对年轻。据统计,其用户约三分之二是Z世代或千禧世代,在美国造访Reddit的人中,有三二%不太使用脸书。原因是,主打「匿名、开放、多元」的Reddit,拥有更多从个人经验出发的分享,打中年轻世代追求「真实」的价值观。

但这条上市路,Reddit走得并不容易。就跟其他社群媒体一样,Reddit也经历过管理层动荡、言论审查引起社群反弹、变现模式不明等危机。创立十九年后,现在这波AI热潮,终于替它带来转捩点。

事实上,它二○二三年,有约九八%的营收都来自广告,但社群媒体的商业模式,在近几年却备受挑战。

一是,Reddit的变现能力不如其他平台,以每名活跃用户能带进的广告营收来看,全球图片分享社群平台Pinterest比它高出约三倍;二是,受到TikTok等其他广告形式更丰富的社群媒体竞争,Reddit的广告营收成长在过去几季也开始趋缓。

如今高质量数据成稀缺资源

这也是为什么,比起广告,市场更看重的是它在招股书中提到的「数据授权」营收成长潜力。

这项数据新产品,才刚正式亮相就已获Google抢先认证。今年二月,它同意将数据授权给Google用来训练其AI模型,为此,Google每年得付出约六千万美元(约合新台币十九亿元)、总金额估将高达逾两亿美元。

单看「一间社群媒体拥有数据」这件事并不新鲜,但Reddit的数据,就是比其他平台更值钱!

AI发展有两大关键:庞大的算力和数据。根据史丹佛人本人工智慧研究院估计,光是用来训练OpenAI旗下大型语言模型GPT-3,所需的数据量就多达五百七十GB,相当于二十五个维基百科的规模。

而Reddit做为一个文字论坛,坐拥的正是数据的宝库。论「量」,它从创立至今已累积超过十亿则贴文,和超过一百六十亿则评论,而且这些数据还会随着用户驱动而自动不断增加。

而它数据的「质」,不只含金量更高,更具有比较优势。首先,造就首波AI浪潮的大型语言模型(LLM),如OpenAI旗下GPT和脸书旗下Llama,需要大量以文字为基础的训练数据集,正是Reddit论坛内容的强项,与以影音、图片为主的其他社群平台不同。

其次,在将数据用于AI模型训练前,需要「清洗」数据,也就是将数据按照属性分门别类、贴上标签,而它旗下的上万个子论坛,已经替AI公司自动做好这件事。例如,如果想训练金融相关的语言模型,特别适合用「WallStreetBets」子论坛(华尔街论坛,关于股票、期货讨论版)里的讨论串当训练数据,其他还有医疗、法律、流行时尚等各种垂直领域的数据可供使用。

另外,现在AI生成内容最为人诟病的「胡说八道(hallucination)」症,也可能透过它的数据减轻。AI生成内容之所以难以完全取代人类、甚至是出错,在于其缺乏与真实物理世界互动的经验。而Reddit内容最大特色,在于它的匿名功能让用户很愿意分享个人经验,也让其资讯更接地气,正好与其他新闻网站、论文、教科书等大数据集互补。

简单来说,Reddit的数据拥有巨量且不断更新、分类标签、人类经验等特色,也让其成为AI时代下必备且稀缺的资源。

看准这点,它从二○二三年就开始布局,调整API(应用程式介面)政策,将原本免费开放给外部的数据改为付费。而对它来说,与Google的授权协议只是第一步,由于招股书上并没有特别列出这是独家授权,因此外界估计接下来还会看到更多授权金入帐。

挑战:功能被取代、用户流失

拥有对的资源,让它能抓紧机运搭上这波AI高速列车,但它并不是从此就高枕无忧。

现在的Reddit,与许多媒体和创作者一样,在AI时代展开之际,也正面临「创新者困境(The Innovator's Dilemma)」。

创新者困境,由哈佛商学院教授克莱顿・克里斯坦森(Clayton Christensen)提出,指的是在市场上站稳脚步的成熟企业,面对破坏式创新时会遭遇的两难困境:应该冒着损害既有业务的风险,去投资新技术?还是选择忽视新技术,但未来可能被掌握新技术的新进者超越?

以Reddit的例子来看,加入AI阵营可以让它获得新的营收成长动能、让自己的内容更容易在AI产品中被看见,也有机会借由合作提升自身AI技术,优化自家平台的内容推荐演算法。

然而,另一方面,当用来训练AI的内容有大量来自Reddit,也就表示未来AI能提供越来越接近它平台上的内容,那么或许有一天,人们想要找答案时,很可能会直接问AI,而不是到Reddit上找;一旦用户开始流失,既有的广告收入也会开始受到打击。

这也是为什么,另一派内容供应商,仍倾向保护自己的资料不加入AI训练。例如,《纽约时报》在二○二三年底控告OpenAI和微软,在未经同意下利用其新闻报导训练AI模型,还可能伤害其声誉。

面对创新者困境时,该怎么选?这并没有正确解答。苹果创办人贾伯斯曾说,「如果你不自己革自己的命,那也会有其他人来动手。」看来,Reddit选择了自己先动手。无论结局如何,它已经在AI时代下重新定位,为自己开拓新道路。接下来,就看这条路能走得多广多远。

※本文由商业周刊授权刊载,未经同意禁止转载。

商业周刊1899期