大模型首次上天 AI天地一体化提上日程
本报记者 李玉洋 上海报道
在今年国庆假期期间,“全球首次卫星在轨运行AI大模型技术验证”这样一条关于“AI大模型上天”的新闻引发人们关注。
新华社10月6日报道,成都国星宇航科技股份有限公司(以下简称“国星宇航”)于近日对卫星AI大模型进行了在轨运行试验,覆盖不同温度工况及各类推理问答类型,任务执行均获得成功。
《中国经营报》记者了解到,用AI大模型赋能卫星产业已是一种业界共识。“在没有AI大模型之前,做卫星遥感的标准流程是卫星上天之后把获得的数据下发到地面接收站,接收站再把数据进行预处理,即处理成一张连续的图片或是满足分析需求的图片,然后人工去找想要的信息。”卫星遥感领域资深从业者沙爱军对记者表示,当卫星数量增加后,单纯靠人是没法业务化运行的,且不稳定。
中国科学院长春光学精密机械与物理研究所图像部主任孙海江曾表示,随着卫星规模增大,全球每天获取的观测数据已经以PB量级测算,传统手动、单一领域的遥感信息提取方法难以适应海量遥感数据的快速解译需求。
记者注意到,包括蚂蚁集团、阿里达摩院、商汤集团以及有华为助力的鹏城实验室在内的公司和研究室都在开发遥感大模型。9月下旬,由中国科学院空天信息创新研究院科研团队联合鹏城实验室研发的全球首个百亿参数级遥感基础模型“空天·灵眸”3.0版发布,其不仅是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的行业基础模型。
“以我们自身发展战略来看,(AI大模型上卫星)是非常重要的一环,也是我们后续发展阶梯的启动。”国星宇航CEO王磊向记者这样阐释大模型上卫星的意义。而沙爱军则认为,卫星上用大模型可能解决以下问题,“第一个是卫星的自控问题,即卫星的飞行安全问题,可把它看作卫星要解决自动驾驶的执行力问题,第二个是做地面信息采集时信息提取的问题”。
全球首次卫星在轨运行AI大模型
据了解,今年9月24日10时31分,由国星宇航与香港中文大学共同研发的全球首颗AI大模型科学卫星在山东海阳搭乘捷龙三号运载火箭成功发射入轨。
9月25日20时46分,试验团队通过地面站以遥控指令形式发送AI任务至卫星;21时11分,卫星在大西洋北部上空通过星载高性能算力载荷成功启动运行AI大模型,AI大模型太空在轨运行过程及结果通过卫星自带的在轨可视化存证系统——“星屏”系统实时展示;22时20分,试验团队通过地面站接收到首次试验完整数据。
自9月25日至10月5日,该卫星总计执行了13次AI大模型在轨运行试验,覆盖了不同温度工况及多种推理问答类型,圆满完成卫星在轨运行AI大模型技术验证的各项预定目标。
本次技术试验的成功,也意味着全球首次卫星在轨运行AI大模型技术验证的成功。
记者注意到,在轨运行试验期间,该卫星AI大模型回答了“你会选择什么超能力?”“国庆节有什么想对祖国说的话?”“国庆节旅游目的地有什么推荐?”等一系列问题。官网显示,国星宇航是国内领先的AI卫星互联网科技公司,由卫星互联网领域的原高校科研院所、互联网领军人才创办。截至目前,国星宇航已完成13次太空任务。
国星宇航通过低成本快响应卫星研制技术体系、全栈AI卫星网络技术体系、高机动快速重访卫星技术体系,形成了面向不同应用场景的B端、G端、C端卫星互联网产品,已服务上百家政企客户。
根据企查查,国星宇航成立于2018年5月,已有5轮融资,近期一笔融资发生在2023年,融资金额超5亿元,由洪泰基金领投,泰山城建集团、青岛海发集团、嘉兴嘉秀集团、策源资本、芜湖产投跟投。
在国星宇航看来,大模型上卫星主要实现哪些功能?
对此,国星宇航方面这样表示:“通过星上算力载荷,开展AI大模型的在轨推理、训练技术验证,为‘天数天算’和下一步的‘地数天算’做好技术积累,推动我国乃至全球AI天地一体化的商业化进程。”
链路带宽是最大瓶颈
据悉,“天数天算”是指卫星在太空中获得的数据无须传回地面,在太空中即可完成计算,依靠的是AI卫星搭载的算力载荷和用之不竭的太阳能;“地数天算”是指将地面的算力需求传输到太空中的算力节点,通过AI卫星搭载的算力载荷进行数据计算。
此外,国星宇航还有着更远大的“征途”。“人工智能与卫星互联网,是中美两国在地球和太空中竞争最激烈、发展最迅速的超级赛道。”国星宇航方面表示,我国迫切需要抓住目前中美在星座组网规模、运载能力等方面存在巨大差距,但单星能力尚未形成代差的时间窗口,以最快速度、最大力度、超常规投入研发AI大模型卫星,“抢先构建天基算力网络,为我国在新一轮信息革命和国际竞争中赢得主动权,实现换道超车”。
在沙爱军看来,所谓的遥感大模型或星载计算、星载智能,直接说就是在想把地面上的云计算搬到天上去,但现实还远没有达到实际需求的程度。
“天数天算的主要问题,在于从天上把数据传到地面的成本高或是效率不够高。”沙爱军说,“天上云计算也好,或者星载计算也好,最大的瓶颈无非是从天到地的一个通讯链路的带宽不够。或者说,是天地之间通联的机会没那么多。”
不过,星载AI仍具有商业应用的想象空间。“比如用卫星采集了遥感影像之后,客户可能不需要整个卫星影像数据,只要里面的船只数量和位置信息,把这些信息通过短报文的形式直接下发到手机上。”沙爱军指出,海运、保险、期货这些应用场景关心船只在港数量、规模以及载货的量、港口码头的货物堆积量,可以统计后用一些模型、算法去预测价格的走势。
关键在于是否有壁垒优势
大模型上卫星,尽管可以用大模型上手机来类比,但也有不同之处。“其实卫星上和地面上的东西,差别主要在于以下两个问题:一是外太空的射线问题,它造成了一些电子设备要加固才能使用;二是功耗问题,地面上可以狂堆硬件,大力出奇迹,但卫星供能主要靠太阳能电板,就意味着有一个上限。”沙爱军表示。
据沙爱军透露,FPGA芯片是目前提供星载AI算力的硬件主流,而把地面常说的CPU、GPU上载卫星是一个趋势。他表示,国外有几家做星载计算的创业公司,员工规模都不大,可能全部约有五六人,做法基本上都是在英特尔这些公司的AI芯片基础上进行加固或封装,将其变成一个标准件,再出售给卫星公司用。
比如,如果一家做材料的公司,能够把电子屏蔽做得很好,把英伟达的GPU进行封装,然后用卫星送到太空去。
就大模型而言,沙爱军认为遥感这个领域其实有大量的开源模型可以借鉴,包括多模态大模型。“遥感要解决的问题就几个:一是目标识别,二是分类,三是变化的识别。”他指出,只要有大量的样本数据,目标识别就能做得好。
至于卫星上为什么要用大模型?沙爱军表示,卫星遥感这个领域肯定逃离不了对大模型的需求,而卫星的自动驾驶和地面信息采集时的信息提取,是他认为最可能落地的两个场景。
2023年12月,一些科研院所和商业航天公司陆续推出人工智能遥感大模型,引发业内关注。2023年,中国科学院空天院发布了Satlas模型,复旦大学也发布了GRAFT模型,模型的数据和参数的规模越来越大,性能越来越强。
在今年的世界人工智能大会(2024 WAIC)上,蚂蚁集团遥感大模型负责人王剑介绍,蚂蚁集团基于蚂蚁百灵大模型平台,已经研发了20亿参数多模态遥感模型SkySense。通过在数据、模型架构和无监督预训练算法等方面的技术创新,SkySense在土地利用监测、地物变化检测等7种常见遥感感知任务上可以贡献技术能力。
从遥感模型的发展趋势来看,呈现出三大趋势:从支持单模态的数据到融合多模态的数据;从只能覆盖单一数据源的影像到可以融合多数据源的影像;从仅支持单张静态影像的解译到融合整个时序影像的信息。
沙爱军指出,虽然业界现在都在说卫星+大模型,但有真正投入的可能不多。在他看来,这种投入关键在于有没有壁垒优势。“做的时候要找到哪些东西是可以做,有些壁垒很容易被大公司打破。我觉得最重要的可能就是数据的壁垒、样本的壁垒,这才是最核心的部分。”他以自己的从业经历来说,很多卫星公司掌握大量数据,但只是把数据存在数据库里,并没有把数据进行清洗或标注,“数据能不能成为一一对应的样本,掌握数据和掌握样本不是一个概念”。