受《周易》启发!北京清华团队发布陆AI光晶片「太极」

北京清华团队发布陆AI光晶片「太极」受《周易》启发。图为光电智慧技术交叉创新团队部分成员合影(左三为戴琼海院士、右二为方璐副教授)。 (微信公众号清华大学)

北京清华团队发布陆AI光晶片「太极」受《周易》启发。图为成果发表在最新一期的《科学》(Science)上。(微信公众号清华大学)

据微信公众号「清华大学」12日消息,北京清华大学电子工程系方璐副教授课题组、自动化系戴琼海院士课题组摒弃传统电子深度计算范式,另辟蹊径首创分散式广度智慧光计算架构,研制全球首款大规模干涉衍射异构集成晶片太极(Taichi),实现160 TOPS/W的通用智慧计算。该研究成果于12日凌晨以〈大规模光晶片「太极」赋能160 TOPS/W通用人工智慧〉为题发表在最新一期的《科学》(Science)上。

方璐、戴琼海为论文的通讯作者,电子工程系博士生徐智昊、博士后周天贶(清华大学水木学者)为论文第一作者。

随着各类大模型和深度神经网路涌现,制造出满足人工智慧发展、兼具大算力和高能效的下一代AI晶片已成为国际前沿热点。

作为人工智慧的三驾马车之一,算力,是训练AI模型、推理任务的关键。光计算,是将计算载体从电变为光,利用光在晶片中的传播进行计算,以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。光晶片,具备高速高平行计算优势,被寄予希望用来支撑大模型等先进人工智慧应用。

智慧光计算作为新兴计算模态,在后摩尔时代展现出有望超越矽基电子计算的潜力。然而其计算任务局限于简单的字符分类、基本的影像处理等。其痛点是光的计算优势被困在了不适合的电架构中,计算规模受限,无法支撑亟需高算力与高能效的复杂大模型智慧计算。

协助光计算「挣脱」算力瓶颈,另辟蹊径,「从0到1」重新设计适合光计算的新架构,是清华团队迈出的关键一步。

方璐将这次科研历程比拟为浪漫的「双向奔赴」:从演算法架构上自顶向下探索,在硬体晶片设计上自底向上推演。

相异于电子神经网路依赖网路深度以实现复杂的计算与功能,「太极」光晶片架构源自光计算独特的「全连接」与「高并行」属性,化深度计算为分散式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智慧光计算探索了新路径。

论文第一作者、电子系博士生徐智昊指出,在「太极」架构中,自顶向下的编码拆分-解码重构机制,将复杂智慧任务化繁为简,拆分为多通道高并行的子任务,构建的分散式「大感受野」浅层光网路对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。

团队以周易典籍「易有太极,是生两仪」为启发,建立干涉-衍射联合传播模型,融合衍射光计算大规模并行优势与干涉光计算灵活重构特性,将衍射编解码与干涉特征计算进行部分/整体重构复用,以时序复用突破通量瓶颈,自底向上支撑分散式广度光计算架构,为片上大规模通用智慧光计算探索了新路径。

通俗来讲,干涉-衍射的组合方式仿佛就是在拼乐高玩具。乐高积木可以通过一个模组凹槽与另一个模组凸起的契合来完成两个组件的拼接。在科研团队眼中,一旦把干涉、衍射变成基础模组,进行重构复用,可以凭借丰富的想像力搭建出变化无穷的造型。

据论文报导:「太极」光晶片具备879 T MACS/mm²的面积效率与160 TOPS/W的能量效率,首次赋能光计算实现自然场景千类物件识别、跨模态内容生成等人工智慧复杂任务。

「太极」光晶片有望为大模型训练推理、通用人工智慧、自主智慧无人系统提供算力支撑。

方璐表示,「之所以将光晶片命名为『太极』,也是希望可以在如今大模型通用人工智慧蓬勃发展的时代,以光子之道,为高性能计算探索新灵感、新架构、新路径 。」

北京资讯科学与技术国家研究中心的光电智慧技术交叉创新团队由来自电子系、自动化系、积体电路学院、软体学院的领域学者和专门研究人员组成。

方璐认为,这次突破性科研成果的成功取得,是北京清华大学深入推进有组织科研的一次生动实践。

该课题受到科技部2030「新一代人工智慧」重大项目、国家自然科学基金委杰青项目、基础科学中心专案,清华大学-之江实验室联合研究中心支持。

在合作者中,有来自各个学科、不同背景的成员。集思广益,多学科、多角度地探索更多解决途径。