AI周报|智谱AI、生数科技等完成新一轮融资;ChatGPT每天耗电或超50万千瓦时
Figure首发OpenAI大模型加持的机器人demo
美国时间3月13日,机器人初创公司Figure发布了第一个OpenAI大模型加持的机器人demo。虽然只用到了一个神经网络,但却可以听从人类的命令,递给人类苹果、将黑色塑料袋收拾进框子里、将杯子和盘子归置放在沥水架上。Figure发布的视频显示,机器人整套操作的动作十分流畅。团队特别强调,所有这些行为都没有经过远程操作,而是通过机器人自主学习。
根据Figure团队负责人Corey Lynch的介绍,基于OpenAI的大模型,通过端到端神经网络训练,Figure 01能够完成快速、简单、灵巧的动作。OpenAI同时还公开了与Figure更进一步合作的计划,将多模态大模型的能力扩展到机器人的感知、推理和交互上,开发能够取代人类进行体力劳动的人形机器人。
点评: Figure成立于2022年,团队成员包括来自波士顿动力、特斯拉、谷歌DeepMind的顶尖机器人专家,成立至今,Figure的融资总额已经达到7.54亿美元(折合约54.26亿人民币)。2023年4月,Figure获得Aliya Capital Partners等10家投资者的7000万美元A轮融资,当年7月再次获得Big Sky Partners和Intel Capital的900万美元融资。就在前不久的3月1日, Figure宣布获得6.75亿美元(折合约48.58亿人民币)高额融资,投资方包括微软、OpenAI、英伟达、英特尔等,估值达到26亿美元(折合约187.12亿人民币),一举跃升独角兽。
智谱AI完成新一轮融资
3月14日,国内头部大模型初创公司智谱AI传出2024年初已完成新一轮融资,北京市人工智能产业投资基金参与投资。智谱AI没有披露此次融资的具体金额。
据悉,这是北京市人工智能产业投资基金成立以来投资的第一家AI大模型公司。北京市人工智能产业投资基金是去年9月北京市政府投资引导基金拟联合社会资本组建设立的,致力于加快推动北京市 AI 产业高质量发展,支持底层关键核心技术突破,促进适合首都定位的重大创新成果在京落地产业化,营造 AI 产业创新生态。
“本次融资将持续用于基座大模型的进一步研发,与各家产业龙头企业合作,一同在千行百业打造蓬勃繁荣的大模型生态。”智谱AI称。
点评:智谱AI源于清华大学技术成果成立,创始团队此前一直在清华大学计算机系KEG实验室工作。CEO张鹏毕业于清华计算机系,总裁王绍兰为清华创新领军博士。2023年3月14日,智谱AI推出千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B。据张鹏介绍,截至目前,智谱AI的开源模型在全球下载量已超过1300万次。
多模态大模型公司生数科技宣布完成数亿元融资
3月12日,多模态大模型公司生数科技宣布完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。本轮融资将主要用于多模态基础大模型的迭代研发、应用产品创新及市场拓展。本轮融资前,生数科技已完成两轮近亿元融资,投资方包括蚂蚁集团、BV百度风投、锦秋基金、卓源亚洲等。
点评:生数科技成立于2023年3月,聚焦图像、3D、视频等原生多模态大模型的研发,是国内最早布局多模态大模型的创业公司之一,其联合创始人兼CEO唐家渝出身清华大学自然语言处理实验室,曾任瑞莱智慧副总裁、腾讯优图实验室高级产品经理,首席科学家朱军是清华人工智能研究院副院长,清华智能技术与系统国家重点实验室主任,团队还有来自北京大学和阿里巴巴、腾讯、字节跳动等科技公司的多位技术人才。
AI视频大模型创企爱诗科技完成亿级A1轮融资
3月11日,爱诗科技宣布完成亿级人民币A1轮融资,本轮融资由国内一线投资机构达晨财智领投,光源资本担任独家财务顾问。爱诗科技创立于2023年4月,由字节跳动前视觉技术负责人王长虎创办,专注解决AI视频大模型及应用。据公司介绍,爱诗科技团队成员来自清华、北大、中科院等知名学府,曾任职于字节、快手、腾讯、微软研究院等核心技术团队。爱诗科技的海外版产品PixVerse于今年1月正式上线,同时,国内版(爱诗视频大模型)也于近日上线内测。
点评:王长虎曾带领字节跳动视觉技术团队从0到1支撑了抖音与TikTok等视频产品的建设和发展。关于未来发展,王长虎表示,接下来3至6个月,爱诗最重要的目标是,技术上能够追平甚至赶超Sora,做出更好的产品,同时也会持续推进国内和海外产品的更新迭代,在2024年底做到大规模的C端应用落地。
AI驱动美图2023年净利润增超2倍
3月15日,美图公司(1357.HK)发布2023年财报,美图实现总收入27亿元,同比增长29.3%;经调整后归属于母公司权益持有人净利润3.7亿元,同比增长233.2%,这一数据剔除了包括加密货币减值亏损回拨等非经营项目的影响。
美图将这一增长归因为基于生成式AI相关技术驱动的影像与设计产品业务收入大幅增长。该业务2023年收入13.3亿元,同比增长52.8%,它的主要收入模式为付费订阅。财报表示,生成式AI技术驱动下,影像产品组合的付费订阅用户渗透率持续快速上升,"尤其是解决影像生产力的产品美图设计室、开拍等,在用户增长及付费订阅转化等表现让人满意。"
点评:对美图而言,AIGC的出现也是其业务的转折点,2023年开始,美图在旗下各个App上都更新了AIGC相关功能,并在年中密集推出了7款AI产品,其中包括美图视觉大模型MiracleVision(奇想智能)。业绩会上,吴欣鸿谈及上个月文生视频产品 Sora的发布,表示这给了美图较大的心理冲击,"我们原本认为这样的能力会在2-3年后被实现,没想到今年初就已经摆在大家眼前了,这让我们反省了美图现有视觉大模型的底层架构,紧急升级了底层框架,重新去投入到图像和视频模型的训练中。"
欧洲软件巨头加快AI部署
欧洲软件巨头SAP近日提出要做“全球第一的商业AI公司”目标,目前内部ERP、供应链、人力资本、采购、客户关系、业务平台都已嵌入AI功能。SAP全球执行副总裁、大中华区总裁黄陈宏表示,“我相信所有的企业都拥抱AI的,一个潮流来的时候跟它斗是斗不过的,除了粉身碎骨没有好处,只能拥抱潮流。”
该公司今年年初曾对外公布一项耗资20亿欧元的重组计划,预计到2024年末,公司员工人数将“与目前水平相似”。此外,该公司承诺,将投资超过10亿美元,通过其企业资本公司Sapphire Ventures在人工智能驱动的技术初创公司中开辟新的领域。
点评:ChatGPT的影响正在各个行业发酵。在SAP看来,如果企业不考虑AI带来的影响,未来将会在竞争中落后。据公开信息显示,SAP每年投入在AI上的研发费用超过60亿美元,这也代表了全球软件行业在AI上的投资趋势。
腾讯推出图生视频模型
3月15日,腾讯与清华大学、香港科技大学联合推出图生视频模型“Follow-Your-Click”。使用者可点击对应区域并加上提示词,使特定对象运动。从放出的视频看,运动时间为几秒。虽然生成时长与Sora的60秒连贯视频难以匹敌,但从放出的示例看,解决了目前主流图生视频工具在选定运动对象并精准控制运动方面问题。
点评:国内视频生成领域取得又一进展,字节跳动今年1月则推出文生视频模型MagicVideo-V2,创业公司生数科技和爱诗科技年内均有追赶Sora的目标。然而,图生视频需先有图片,目前在AI生图领域,国内和海外先进水平差距依然明显,有AI应用研究人员告诉记者,双方的差距大约一个版本,或时间上半年到一年的距离。
AI是否让程序员消失引起热议
关于AI让程序员消失,近期开始新一轮热议。近日英伟达 CEO 黄仁勋再次提起“编程无用论”,称“你只需要看看YouTube,看看所有使用提示工程(prompt)的人,所有孩子正在用它(AI)做出惊人的事情”。百度创始人、董事长兼CEO李彦宏则表示,以后基本上不会存在程序员这种职业,所有人只要会说话,就能具备今天程序员所具备的能力。站在反方的是360董事长周鸿祎,他认为程序员热十年内不会减弱。
业界展开辩论之际,3月12日晚的大洋彼岸,初创公司Cognition发布首个AI软件工程师Devin,根据官方的报告,只需一句指令,就可端到端地处理整个开发项目。
点评:第一财经记者采访了中美多名身处一线的程序员。他们普遍表示,尽管未来的危机感隐隐出现,但目前并不强烈。科技企业和程序员群体已在用AI替代或辅助一部分工作,去年11月的一次公开场合,李彦宏曾透露百度有20%代码由AI来完成,且比例在不断增加。不少程序员在工作中也用大模型替代谷歌等传统搜索引擎。不过,一些程序员感受到,AI仍难以替代需通过人与人交流推进的工作,也难以解决复杂问题,AI和人类程序员未来可能形成分工,由程序员完成更上层的思考和设计。
高盛分析师:英伟达之后,AI投资还有三大阶段
高盛分析师瑞恩•哈蒙德(Ryan Hammond)在最新报告中表示,随着2023年ChatGPT出现,人工智能投资第一阶段开始,为英伟达提供了巨额利润。此后AI投资还有三大阶段值得关注。第二阶段关注参与构建AI所需基础设施的其他公司,第三阶段关注将AI整合进产品并提高收益的公司,第四阶段关注AI生产力,AI将应用于各行业,这些公司可利用AI提高生产力。
点评:英伟达股价受AI催化一路飙升,3月15日收盘市值达2.2万亿美元,关于英伟达的股价增长是否存在泡沫,市场存在讨论。英伟达之外,投资机构也在寻找后续机会。瑞恩•哈蒙德认为,在AI投资的第二阶段,值得关注的包括博通、英特尔等其他无晶圆厂芯片设计公司、晶圆制造商,微软、亚马逊等云提供商也将受益。第三阶段主要受益者可能是软件公司,包括Adobe、Meta及硬件供应商苹果。第四阶段,软件服务和商业服务等行业具有潜在增长机会。
ChatGPT每天耗电或超50万千瓦时
有消息称,聊天机器人ChatGPT每天需要响应超过2亿次请求,其电量消耗可能超过每天50万千瓦时。相比之下,美国普通家庭每天的平均用电量29千瓦时,这意味着ChatGPT的日耗电量是普通家庭的1.7万倍以上。去年Joule 杂志的一篇论文中,荷兰国家银行数据科学家亚历克斯·德弗里斯估计,若谷歌将生成式人工智能整合到每次搜索中,其用电量将上升到每年290亿千瓦时左右。这高于肯尼亚、危地马拉和克罗地亚等国一年用电量。
点评:大模型的三大要素是数据、算力和算法,大模型对大规模算力存在依赖。英伟达CEO黄仁勋此前表示,不能只想着购买更多计算机,还必须假设计算机速度会越来越快,因此所需总量不会这么多了。如果假设计算机速度不会变快,可能得出一个结论——我们需要14个不同的行星、3个不同星系、4个太阳为这一切提供燃料。特斯拉CEO马斯克则认为,一年前短缺的是芯片,下一个短缺将是电力基础设施。
三星HBM3进入英伟达供应链
TrendForce集邦咨询资深研究副总吴雅婷近日表示,目前NVIDIA现有主攻H100的存储器解决方案为HBM3,SK海力士是最主要供应商,但供应不足以应付整体AI市场所需。至2023年末,三星以1Znm产品加入NVIDIA供应链。此外,三星是AMD长期以来最重要的策略供应伙伴,今年第一季度,三星HBM3产品陆续通过AMD MI300系列验证。过去HBM3竞争中未加入供应行列的美光,也将成为供应商。
点评:GPU芯片算力一大瓶颈来自内存带宽,DRAM(动态随机存取存储器)堆叠而成HBM(高带宽内存)并与GPU一起封装的方案可提升带宽,英伟达和AMD采用了这一方案。DRAM厂商掀起HBM竞赛,目前SK海力士跑得最快,三星奋起直追,HBM竞赛可能使DRAM厂商的座次重新排列。有消息称SK海力士HBM3芯片生产良品率达70%,三星则为10%至20%,为弥补不足,三星计划采用SK海力士使用的一项芯片制造技术,并下达了相应的芯片制造设备采购订单。
搜索引擎曾出现GPT-4.5 Turbo产品页面
有网友发现搜索引擎必应和DuckDuckGo上,近日一度能搜到GPT-4.5 Turbo产品页面。其中,DuckDuckGo的页面摘要显示,GPT-4.5 Turbo将“在速度、准确性和可扩展性方面超越GPT-4 Turbo”,支持25.6万tokens的上下文窗口,但相关链接很快下架。目前尚不清楚是搜索引擎发生错误还是GPT4.5 Turbo即将推出。在竞争对手Anthropic推出多项基准测试得分超GPT4的Claude3后,业界有声音认为给到OpenAI压力,或加快下一代GPT推出。
点评:OpenAI虽未正式推出GPT-4.5 Turbo或GPT-5,但大模型竞争加剧仍给到OpenAI一定压力,若加快其新产品发布也并不奇怪。美国当地时间周三,OpenAI CTO Mira Murati(米拉·穆拉迪)透露,文生视频模型Sora或将于今年末发布,OpenAI正在通过红队测试确保Sora的安全和可靠性。此外,OpenAI还通过与人形机器人公司Figure AI的合作"秀"了一波应用至人形机器人领域的能力。