AI周报|商汤新模型发布后股价大涨;月之暗面否认创始人套现数千万美元

商汤发布日日新5.0:对标GPT-4 Turbo

4月24日,商汤科技股价大涨超过30%后紧急暂停交易。就在4月23日,商汤举办技术交流日活动,推出了6000亿参数大模型日日新5.0,官方发文表示这是“中国首个GPT-4 Turbo级别的大模型”,日日新5.0大模型具备更强的知识、数学、推理及代码能力,综合性能全面对标 GPT-4 Turbo,并在主流客观评测上达到或超越 GPT-4 Turbo。

在实际使用中,商汤表示该模型在自然语言能力方面,创意写作、推理以及总结能力均大幅提升,文生图能力也有较大提升,商汤提到其多模态大模型的图文感知能力达到全球领先水平。

点评:本次更新主要聚集增强了知识、数学、推理及代码能力。日日新5.0模型能力提升一方面得益于采用混合专家架构(MoE),激活少量参数就能完成推理,且推理时上下文窗口达 200K 左右,其次模型基于超过10TB tokens训练、覆盖了数千亿量级的逻辑型合成思维链数据,此外也得益于商汤AI大装置SenseCore算力设施与算法设计的联合调优。近期Anthropic、Meta等海外企业发布最新模型,一些基准测试得分超过GPT-4,颇有超车OpenAI的意思,国内终于也有了商汤日日新5.0。与此同时,竞争可能要进入新阶段,GPT-5可能今年夏天要推出,OpenAI已放出GPT-5性能远超GPT-4的信号。

英伟达再出手收购以色列公司

当地时间4月24日,英伟达宣布,已与以色列公司Run:ai签订最终收购协议,英伟达认为,这能够帮助客户更有效地利用其AI计算资源。Run:ai成立于2018年,是一家基于开源容器编排平台Kubernetes的工作负载管理和编排软件提供商,公司产品可提高GPU集群的资源利用率。有消息称,英伟达收购Run:ai的交易金额为7亿美元。英伟达近期还收购了另一家以色列初创公司Deci,这是一家成立于2019年,提供高效的生成式AI和计算机视觉模型的公司,其解决方案可通过调整AI模型大小使模型在AI芯片上更便宜地运行。

点评:英伟达对以色列初创公司多有青睐,2019年,英伟达还击败英特尔、微软等潜在投资者,以总价约70亿美元收购以色列网络技术供应商Mellanox,这是英伟达布局高速网络的一笔重要收购。从这两笔新收购可以看出,英伟达正在布局GPU集群资源高效利用并助力客户降低使用AI的成本。目前AI大模型算力成本高企有目共睹,大模型训练一次可能需要上千万美元,其背后是AI芯片能效难以提升和功耗难以下降。在芯片制程之外,英伟达正在寻求更多解决方案,推动AI平民化实现。

苹果收购巴黎人工智能初创公司Datakalab

据法国媒体报道,苹果收购了专注于“人工智能压缩算法和计算机视觉技术”的巴黎初创企业Datakalab。这笔收购已经于去年12月完成,两家公司本月向欧盟委员会报告了这笔交易。

Datakalab是一家总部位于法国巴黎的 AI 初创公司,专注于人工智能压缩和计算机视觉技术。Datakalab 将自己描述为“低功耗、运行时高效和深度学习算法方面的专家”,系统可以在设备端运行。这家公司曾经在2020年5月与法国政府合作,将AI工具部署到巴黎的公共交通系统,来检查乘客们是否佩戴口罩。

点评:市场认为,此次收购是苹果更广泛 AI 战略的一部分,旨在将更复杂的 AI 技术引入其设备,例如即将推出的 iOS 18 机型和未来的 Apple Vision Pro。在今年2月的财报电话会议上,苹果CEO库克曾透露,苹果(在AI方面)有一些令他们感到非常激动的事情,将在今年晚些时候讨论。苹果在大模型领域走得不算快,是要自研还是通过收购补全AI能力,抑或终端设备直接搭载外部大模型公司的产品,外界还在等苹果作出决策。

OpenAI CEO投资能源初创公司Exowatt

据外媒报道,近日能源初创公司Exowatt获得了来自OpenAI CEO奥尔特曼(Sam Altman)以及硅谷知名风投公司安德森·霍洛维茨(Andreessen Horowitz)等投资者2000万美元(约合1.45亿元人民币)的种子轮投资。

Exowatt于2023年成立,旨在用太阳能解决大型数据中心对清洁能源的需求。据悉,与将太阳光直接转化为电能的传统太阳能电池板不同,Exowatt 使用一种独特的方法,涉及储存热量而不是电力,它将太阳能存储在热电池中。该公司开发了一款专为数据中心供电的三合一模块化能源系统,将集热器、热电池,以及能够提供可调度电力和热量的热机进行结合。

点评:这并非奥尔特曼第一次投资能源公司,在此之前,他曾投资 Helion Energy 和 Oklo,这两家分别是专门从事可控核聚变和核裂变发电的能源公司。AI的尽头是能源,一份研究显示,ChatGPT一天可能耗电50万千瓦时,是美国家庭平均每天用电量的1.7万多倍。在此前举办的达沃斯世界经济论坛上,奥尔特曼表示,未来人工智能需要能源方面的突破,因为人工智能消耗的电力将远远超过人们的预期。投资能源企业,意味着OpenAI可能寄希望于能源领域的变革为AI算力提供支撑。

AI搜索初创公司Perplexity AI获新一轮6300万美元融资

4月24日,AI搜索引擎初创公司Perplexity AI在社交平台宣布,获得6270万美元融资,估值10.4亿美元。本次由Daniel Gross领投,Stan Druckenmiller、NVIDIA、Jeff Bezos、Tobi Lutke、Garry Tan、Andrej Karpathy等跟投。

Perplexity AI提供生成式AI搜索引擎服务,支持用户通过自然语言搜索任何信息,可以把Perplexity AI看成搜索引擎版的“ChatGPT”。

资料显示,Perplexity AI创立于2022年8月,同年9月获得310万美元种子轮融资,12月发布问答引擎“Ask”,随后其业务实现飞速增长,4个月后月活用户便突破200万成为生成式AI搜索引擎领域的黑马,这也是能获得微软、谷歌、GitHub等投资的重要原因之一。

点评:Perplexity AI表示,像ChatGPT这种问答模式彻底颠覆了应用的交互模式,简化了大量手动业务,使人们获取信息的方式更加便捷、广阔。同时这也为Perplexity AI提供了机会,通过智能技术创新向传统搜索引擎发起挑战。海外对初创公司的大笔融资仍在进行中,可以看出AI搜索引擎仍是一个重要方向。

爱诗科技完成A2轮超亿元融资,蚂蚁集团领投

4月23日,光源资本官方发文表示,爱诗科技完成A2轮超亿元融资,由蚂蚁集团领投,光源资本担任独家财务顾问。至此,爱诗科技一年内累计获得融资超2亿人民币,成为中国视频大模型领域融资规模最大的创业公司。据悉,本轮融资将用于进一步迭代自研视频生成大模型,并升级团队,加快实现 AI 视频生成技术的行业应用。

点评:爱诗科技成立于2023年4月,创始人兼CEO王长虎曾任字节跳动视觉技术负责人。爱诗科技于2024年1月正式发布文生视频产品 PixVerse,官方表示目前月访问量超百万,视频生成量累计超千万,被创作者广泛应用于影视、广告、动漫等内容制作中。创始人王长虎表示,希望未来 AI 原生视频能够融入内容行业的生产和消费链路,为 AIGC 领域带来持续的活力。Sora推出后,国内视频生成赛道也火热起来,生数科技已拿出Vidu大模型,爱诗科技接下来的动作备受期待。

视频大模型Vidu发布

在2024中关村论坛年会未来人工智能先锋论坛上,清华大学联合生数科技发布中国首个长时长、高一致性、高动态性视频大模型Vidu。该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。

点评:据清华大学教授、生数科技首席科学家朱军介绍,Vidu采用的是“一步到位”的生成方式。与Sora一样,文本到视频的转换是直接且连续的,在底层算法实现上是基于单一模型完全端到端生成,不涉及中间的插帧和其他多步骤的处理。今年2月Sora发布后,团队基于对U-ViT架构的理解及长期积累经验,在两个月中进一步突破长视频表示与处理关键技术,推出该模型。从发布的视频看,Vidu画面较真实,但已放出的视频还是几秒的视频,动作衔接还有不流畅之处,后续应还有较大改进空间。

“AIGC第一股”出门问问上市首日破发

4月24日,顶着“AIGC第一股”的名号,出门问问(02438.HK)正式登陆港交所,上市即破发,其发行价为3.8港元/股,开盘下跌21.58%至2.98港元/股,截至当日收盘出门问问股价为3.68港元/股,下跌3.16%,市值为54.89亿港元。

据出门问问提交的招股书,该公司2021年—2023年的收入分别为3.98亿元、5亿元和5.07亿元。2021年—2023年出门问问归属于公司权益股东的年内全面亏损总额累计超过20亿元,扣除可赎回优先股和普通股的账面值变动、以股份为基础的薪酬和上市开支后,该公司2021年的经调整净亏损为0.73亿元人民币,2022年和2023年的经调整净利润分别为1.09亿元人民币和0.18亿元人民币。

点评:出门问问成立于2012年,是谷歌前科学家李志飞创办的AI公司,以生成式AI与语音交互技术为核心业务,拥有自研大模型“序列猴子”,为内容创作者、企业和消费者等用户提供AIGC(AI生成内容)解决方案、AI企业解决方案、智能设备和配件等服务。出门问问提供的数据显示,该公司目前在全球拥有超过1000万名AIGC解决方案用户,其中约84万名是付费用户。上市首日破发,或意味着资本市场对相关AIGC产品的商业化能力仍有顾虑。

腾讯三成代码由AI代码助手生成

腾讯云近日发布消息称,腾讯有三成代码是腾讯云AI代码助手写的。腾讯研发人员比例超74%,腾讯基于混元大模型推出了该AI代码助手,每天有一半的腾讯员工使用AI代码助手,代码生成率超30%。该助手或“AI程序员”可智能补全代码信息、高效完成编码工作、修复错误代码、解释既有代码、进行人工智能技术对话。腾讯云AI代码助手还准备进入金融等更多行业。

点评:越来越多“AI程序员”进入科技大厂工作了。有意思的是,不久前百度透露其每天新增代码中有27%是由智能代码助手Comate生成的,比例也接近三成。这或许意味着,现阶段AI能替代人类程序员做的工作比例大约是30%,更多可能就不现实了。不久前,Cognition Labs的AI编程产品Devin被质疑编程能力存在一定欺骗性,有问题很多是Devin“自导自演”修复的。将AI作为人类程序员的帮手而不是替代程序员,是目前比较现实的路径。值得期待的是,这些大厂除了自己用代码助手外,后续还会开放给什么行业、带来什么变化。

SK海力士计划投资超1000亿元扩产

有消息称,SK海力士计划斥资约20万亿韩元(约146亿美元)在韩国建新的存储芯片产能,进行产能升级,以满足快速增长的AI开发需求。这家韩国公司将初步拨出5.3万亿韩元,于4月底左右开始建设一家新工厂或晶圆厂,计划在2025年11月完工。

点评:SK海力士是主要的DRAM(动态随机存取存储器)厂商之一,目前因AI需求火爆,由多颗DRAM堆叠而成的HBM(高带宽存储器)供不应求,SK海力士是英伟达HBM的主要供应商。除了SK海力士,三星也在努力挤进英伟达供应链。因HBM需求拉升,DRAM厂商之间的竞争俨然变成HBM之争。除了技术领先性之外,谁能更快速增加产能并快速量产,谁就在AI时代有更多机会。

月之暗面否认创始人杨植麟套现数千万美元

有消息称人工智能初创公司月之暗面创始人杨植麟通过售出个人持股已套现数千万美金,创始人及相关人员套现金额在4000万美金。还有市场传言称,曾参与投资过杨植麟首个创业项目“循环智能”的前金沙江创投管理合伙人张予彤已从金沙江创投离职,将加入月之暗面。对于以上市场传言,月之暗面相关负责人回应称,创始人套现消息不实,月之暗面此前已公布员工激励计划,张予彤并未入职月之暗面。

点评:从既往融资看,月之暗面确实“很有钱”。公司已完成三轮融资,今年2月以15亿美金投前估值完成超10亿美元B轮,阿里领投,砺思资本、小红书跟投,投后估值约25亿美元,是国内最主要的大模型独角兽之一。月之暗面此前因长文本的聊天应用kimi受到市场关注,在资本市场甚至带起一众“kimi概念股”。不过,高涨的热度下,外界更期待月之暗面能拿出商用更成功的产品,证明自身具有持续造血的能力。

OpenAI CEO称GPT-5性能远超GPT-4

4月25日,OpenAI联合创始人兼首席执行官萨姆·奥尔特曼(Sam Altman)在斯坦福大学发表演讲。在一段流出的视频中,奥尔特曼表示,GPT-5会更加智能,这将是历史上最令人瞩目的事件之一,GPT-6则将比GPT-5智能很多,而我们远未触及极限。对于OpenAI产品迭代,奥尔特曼认为尽早且频繁推出AI产品,保持迭代部署非常重要,即便现在看来ChatGPT还有点令人尴尬,GPT-4还显得愚蠢。要让社会为技术进步做好准备,依赖于迭代部署。

点评:随着多个竞争对手发布更新、更强的大模型,外界期待OpenAI会拿出什么样的产品应对。奥尔特曼透露GPT-5性能远超GPT-4,更增强了人们的期待。近期关于OpenAI下一代大模型的消息频繁传出,中信证券近期研报称,GPT-5正处于红队测试阶段,预计最快今年夏天面世,GPT-5预计继续采用MoE(混合专家模型)架构,有望在多模态理解、长文本输入等方面取得新里程碑。看来,GPT-5将很快到来。

阿里、百度、腾讯云抢食Llama 3算力

Meta发布Llama 3系列两个开源大模型之后,百度、阿里、腾讯等云厂商迅速抢食Llama 3的算力部署需求。4月22日,阿里云宣布百炼大模型服务平台推出针对Llama 3系列的限时免费训练、部署、推理服务。腾讯云同日宣布腾讯云TI平台成为国内首批支持Llama 3全系列模型的平台之一。4月19日,百度智能云千帆大模型平台则宣布成为国内首家推出针对Llama 3全系列版本训练推理方案的云厂商。

点评:相比推理训练更具中心化特点的闭源模型,诸多云厂商都有机会拼抢算力分散的开源模型部署需求。Llama 3已开源版本的基准测试数据亮眼,指令微调的Llama 3 8B在五项基准上得分超Gemma 7B-1t和Mistral 7B Instruct,Llama 3 70B三项基准超过Gemini Pro 1.5和Claude 3 Sonnet。随着Grok-1、Llama 3等相继突破开源模型参数上限,潜在算力需求攀升,如果Llama 3 参数量超4000亿版本性能媲美GPT-4,部署该模型的需求攀升,接入Llama 3的云厂商能吃到的潜在算力红利不会少。

清华大学成立人工智能学院

清华大学成立人工智能学院,聚焦“人工智能核心基础理论与架构”和“人工智能+X”两个重点方向,为实现高水平科技自立自强提供有力支撑。图灵奖获得者、中国科学院院士姚期智担任清华大学人工智能学院首任院长。

点评:清华大学是国内最早开展人工智能教学和科研的单位之一。清华大学1978年建立“人工智能与智能控制”教研组,1985年成立国内第一个智能机器人实验室,1990年建成全国首个以“智能”命名的国家重点实验室。此后,清华还相继成立脑与智能实验室、未来实验室、人工智能研究院、人工智能国际治理研究院、智能产业研究院。如今一批人工智能创业团队有清华背景,包括智谱AI、面壁智能、月之暗面、生数科技等,“清华系”已星光熠熠。此次专门成立人工智能学院并选定重点方向,清华大学有望在人工智能赛道增强引领能力。