大模型时代,一个胰腺癌病人用AI造梦丨AI群像①

南方财经全媒体记者江月 上海报道

2024年上半年,林逸飞一直在争取用大模型改造他的一款医学问答RAG产品,与此同时,他是一名胰腺癌手术预后病人。“胰腺癌的五年生存率只有7%到10%,而我已经用掉了一年。”林逸飞向南方财经全媒体记者称。

林逸飞相信,人工智能的应用可以帮助胰腺癌新患者做更好的疗程安排乃至心理建设。大语言模型在2023年的盛行,给他似乎带来了一个良好的契机,它们带来体验感很好的自然语言问答和检索调取。

这期间,大模型开发热潮有些降温,冷静下来的人们都在等待:AI到底能在什么样的场景里做出什么样的事?AI应用的落地,比人们想象得要慢一些。

有人直言:这只是个梦想计划。在资本堆叠的人工智能市场里,不追求商业变现的想法看起来太梦幻、太不实际了。

“我很理解公益项目从商业变现上说不清楚。”林逸飞向南方财经全媒体记者表示,然而,人们不是一直都说“科技让生活更美好”吗?

林逸飞幸运地在项目运营了快一年之际,遇到了愿意帮助他的人。在大模型公司零一万物运营开源生态团队的林旅强,目前在用开源的资源支持林逸飞做这个医学问答产品。

林逸飞和林旅强接受南方财经全媒体记者的采访,讲述了这个在资本浪潮里用AI造梦的故事。

小胰宝

和把照片AI化、用逼真拟人语气对话的机器人相比,小胰宝看起来太不“炸裂”了。对话框里的回复光标持续闪烁的几秒钟里,它仿佛在慢速思考,而胰腺癌病人在焦急地等待它告诉自己: “请问,出现腹水该如何处理?”“内镜下胆管支架置入术后并发症的预防和管理策略有哪些?”“化疗后引起脚麻,都是怎么处理的,吃什么药?”等等。提问者往往正处在身心的巨大痛苦中。

胰腺癌是全球发病率排名第九位的癌症,每年大约有几十万新发病例。这种病通常在晚期才被发现,也导致恶性率高、预后效果差。可以想象,每个面对确诊消息的病人都将无法接受。

作为一个已经和胰腺癌抗争了一年的病人,林逸飞将自己生命可能是最后一段的时光投入到了自救中,但同时也将自己所搜集到的病患知识用一种程序员的方式分享了出来。

2023年,林逸飞被医生告知存在胰腺癌的风险,他感到这个预言有可能是真的。

他上网搜索“胰腺”。胰腺,脊椎动物具有的担当外、内分泌功能的腺体,产生帮助消化食物的酶和帮助管理血糖的胰岛素;高等脊椎动物的胰由肠上皮细胞特化,人胰横卧于腹后壁和胃后,胰头位于十二指肠弯内,胰体占据大部,胰尾延伸到脾,重约90克。

对一种疾病的了解旅程自此开始,新靶点claudin 18.2、埃克替尼/厄洛替尼/吉非替尼/阿法替尼/奥希替尼、腹水、超进展基因、腹腔转移后腹膜癌……这些新鲜的医学名词,随着一次次手术和治疗从陌生知识海洋里跳出来,一个个砸向林逸飞。

“久病成医”这个词,描述了很多癌症患者患病后的状态。不过,这是针对慢性病人的,对于那些需要争分夺秒、和死神抢时间的病人而言,没有机会给他们“久病”,他们需要在很短的时间(例如几个月)内与医生做出很多决定,这些决定往往是生死决定。

在林逸飞手术后第四个月,他有一种劫后余生的感觉。这段时间里,他获得了确诊的病理报告,但已经在一定知识了解的前提下接受医生给出的详细治疗方案。逐步平复了心情、决心长期抗争病魔之后,他萌生了一个知识分享的想法,作为一个前企业级信息解决方案工程师,他在两周时间之内使用开源资源,以自己学习的资料、病友群的经验和医生信息作为知识库,整合了一个RAG。

“如果掌握科学的治疗知识,患者可以和主治医生、家属商量,确定先做什么、后做什么,他就可以有更长的生存期,可以多陪陪家人、可以少受点痛苦。”林逸飞告诉南方财经全媒体记者,他指出虽然这个时间看起来不长,但对于胰腺癌病人来说“每一天都特别有价值”。“全球每年新增数十万例胰腺癌病患,对他们而言,合适的疗程就是在和时间赛跑。”林逸飞说。

这个RAG被命名为“小胰宝”。林逸飞在小胰宝设置了一个置顶问题,即“胰腺癌的治疗路线图我该怎么设计,才能少走弯路?”这是因为肿瘤治疗通常不是一次或者几次的对症治疗组合,而是按照时间、按照病情进展情况形成的复杂路径,除了内外科治疗,还包括营养支持、心理支持等综合治疗。对于正在和命运之神抢跑的病人而言,几乎不可能掌握路线图设计知识。

林逸飞告诉南方财经全媒体记者,胰腺癌知识其实“是用人命堆积起来的经验”,而“病人的每一次选择都是以生命为代价的”。他引述了一个案例,2024年初,林逸飞在网上偶尔结识了一位外国的胰腺癌病友。这个病友没有接受常规治疗路径,而是激进地优先尝试了一种临床试验方案,但在这个方案宣告失败后,他不再具有回到二、三阶段方案的可能性。

大模型

在应用大模型的初步阶段,小胰宝被在投放到病友群,效果比林逸飞预期得要差。

2023年,大模型爆发式进入开发期。大模型以前所未有的庞大语料库作为数据输入、以庞大算法构建、用巨大算力推动,被认为是一项人工智能具有革命性、划时代的技术。不少人都认为,大模型可以让人工智能产品实现跨越式的功能改善。

但在实际应用开发中,大模型没有想象中那么神奇。

RAG(Retrieval-Augmented Generation)是一种将检索和大语言模型(LLM)结合的人工智能系统,可以被理解为一种大模型的垂直领域应用。

例如首先呈现在眼前的问题是数据依赖性。小胰宝性能很大程度上依赖于检索到的信息相关性和质量。随着用户规模的扩大,病友对疾病产生方方面面的问题,知识库的回答暂时无法面面俱到,甚或与医生面诊意见发生冲突。

很显然,这个简单的小工具还存在其他诸多潜在问题。例如,如果访问量增大,是否检索相关信息可能需要较长的时间、影响使用感?在检索到大量相关信息时,是否能有效地整合这些信息,避免过多的信息导致生成文本的冗余或不连贯?能否做出连贯的解读,将多次检索的信息整合进行完整的解读?

“病人群体的千变万化,决定着这个小工具还有很多改进的空间,而我个人很难完成。”林逸飞向南方财经全媒体记者坦言。眼下,他仍需要接受定期化疗。

小胰宝上线初期,有人在后台投诉,有人在微信病友群中谩骂。林逸飞称:“用户对这种产品的容错率显然几乎是零。再这样下去,小胰宝根本无法继续运作了。”自然,这样的负面评价让原本就是病患本身的林逸飞遭受了身心双重打击。

此外,林逸飞考虑了小胰宝的长期运作问题,他希望能把成本降低至“零”。这主要因为,他对自己生命的预期并不乐观。“我希望未来仍能让其他人无负担地运营小胰宝。”林逸飞坦言。

考虑到压缩成本,林逸飞去掉了“私有化部署”的环节,不购置算力显卡。不过,使用大模型API要为消耗token付费,这是绕不过去的一个付费环节。

为了压缩费用,林逸飞向多家大模型开发公司发出了请求。“我向很多家大模型公司都发了邮件,内容是介绍小胰宝产品,需求是请对方开放更多的token给我。”林逸飞称。这个AI造梦计划,得到了大模型开发商零一万物的回应。

零一万物给林逸飞的回复,在林逸飞看来非常慷慨。零一万物不仅免费提供了所有API token,还有一位团队负责人愿意帮助林逸飞。

2024年5月初,零一万物开源及开发者生态部的两名同事在上海面见了林逸飞,两周后,该部门负责人林旅强在工作汇报过程中将此事汇报给了零一万物的人资负责人,其转述给了李开复。

“开复博士已经知晓此事,并表示支持。”林旅强告诉南方财经全媒体记者。他表示,他计划推动小胰宝以开源社区的形式开发下一个版本,而这将在零一万物对其工作许可的前提下进行。南方财经全媒体记者向零一万物确认了项目得到的内部支持。

给科技一点温度

截至2024年6月初,小胰宝2.0版本仍然在技术筹备当中。小胰宝是否终将成长为一款理想的医疗垂直AI工具?市场如何为科技落地的过程买单?一场轰轰烈烈的科技浪潮除了能掀起金钱涌动,还能否顺便带给人间一些有温度的美好?

上海亿琪软件有限公司CEO褚建琪向南方财经全媒体记者表示,他此前已经听闻小胰宝,很佩服林逸飞与命运搏斗的精神,但他坦言,小胰宝更接近梦想计划,成功的可能性并不高。事实上,他认为大模型讨论过热,而应用落地则要比人们想象要难得多。

“大模型太热了,但应用变现迟迟不出现,市场太浮躁了。”他称。

在褚建琪看来,医疗领域的人工智能应用开发成本比较高。“像这样一款医疗领域知识库,需要非常专业吧?那你得让真正的医学一线、顶级专家参与,这可能吗?”

除此以外,大模型本身就是一项资本堆叠的投资。他指出,应用落地还需要模型调优、本地部署,意味着庞大的算力投入、技术人员投入。“现在买卡(算力芯片)有多不容易、多昂贵,可以想见投资之巨。”他称。

但ROI投资回报率分析不能击退所有的AI造梦计划。

“我不寻求在市场上一枝独秀,我只寻求对需要的人提供他们易获得的产品。”林逸飞称。“另外,会有大公司做这件事吗?我个人是怀疑的。”

由于小胰宝的垂直领域十分狭窄,林逸飞感受到了大公司的壁垒。从他一次次的对外求助中,他称:“你能感受到那种不对等性是做公益的最大阻碍。”他感到需要帮助的自己、医患群体是多么渺小,而具备帮助能力的大公司是多么庞大。

尽管也有大模型公司在帮助外部创业团队打造垂直领域智能体,但小胰宝的需求并未被太多人听见。

目前,开源世界的力量被林逸飞看作一条出路。“开源精神可以打破这种不对等性。”林逸飞称。一些技术达人正在林旅强的号召下认识小胰宝。“我需要找到一些愿意稳定为小胰宝贡献时间的人。”林逸飞表达了他的需求。

而对于林旅强而言,他也愿意为小胰宝尽量做多一些。“我们加入到小胰宝开源项目中,从开源项目治理来真的帮助到项目能更健康的持续成长。毕竟,当前这个项目就是林逸飞一个人搭建起来的,如果我们单纯给到token,但林逸飞如果接下来无法继续投入这个项目了,其实小胰宝也就停滞甚至停止了。”林旅强向南方财经全媒体记者表示。

如果小胰宝能向前走得更远一些,也许会号召更多开发者使用大模型进行应用开发。“这可以成为零一万物Yi模型的use case。”林旅强称。

而林逸飞还有更多规划,他称:“在胰腺癌领域的探索不会只成就一个产品,如果成功了,未来我们还希望向乳腺癌等更多的癌种扩展,这将获得更多的市场需要。”

资本属性仍然趋势科技以冰冷的面孔前行,然而在这场全民关注的科技热潮中,以人为本的理念不应该被忘却。科技本身是客观、没有温度的,但使用科技的人心是有温度的。

(小胰宝创始人在开发者社区使用英文名和真名活动,但其仍然希望在大众媒体中保持匿名,为了尊重他的意愿,本文采用了林逸飞这个化名)