14岁读大学,26岁当博导,清华大学科研女神,芯片研究再获突破,登上Science!

今日,清华大学戴琼海院士、方璐副教授课题组探索出一种分布式衍射干涉混合光子计算架构——光子芯片太极,以有效地将ONN的规模提高到百万神经元水平。

方璐

方璐,清华大学副教授、博士生导师;2003年,她以优异的成绩考入国内顶尖学府中国科技大学(14岁);2007年—2011年她获得香港科技大学电子与计算机工程学系博士学位;2012年,她先后在香港科技大学和新加坡科技与设计大学进行博士后的研究工作。此期间,还曾在美国西北大学,做了半年的访问学者;2012年11月被母校中国科学技术大学聘为电子工程与信息科学系副教授、博士生导师,后去清华任职。相关工作发表在Nature及子刊, IEEE TPAMI, Engineering,中国科学等期刊,和CVPR, ICCV和ICCP等会议。获中国电子学会科技进步一等奖、MIT TR 35中国区科技创新青年、2021达摩院青橙奖。任IEEE TIP和IEEE TMM期刊编委。

戴琼海

戴琼海院士,清华大学自动化系教授,清华大学生命科学学院兼职教授,中国工程院院士。长期致力于立体视觉和计算摄像理论、关键技术研究与人才培养,主持承担了国家科技部重大基础研究973项目和国家基金委重大仪器项目,在立体视觉、三维重建和计算摄像仪器等方面做了基础性和开拓性工作,获国家技术发明一等奖、国家技术发明二等奖和国家科技进步二等奖各一项。培养研究生及博士后近百名,出版专著3部,发表论文百余篇,授权发明专利76件

去年10月份,清华大学吴嘉敏助理教授、乔飞教授、方璐教授和戴琼海院士提出了一种结合电子和光计算的全模拟芯片(ACCEL)。相关研究成果以题为“All-analog photoelectronic chip for high-speed vision tasks”发表在《Nature》上。

今日,戴琼海院士、方璐副教授成果再次发表在《Science》上,下面,就让小编带大家一起观摩一下大佬的研究成果。

光子芯片太极问世

随着人工通用智能(AGI)的快速进展,对高性能计算的需求不断增长,特别是在处理复杂多模态信息时。但在摩尔定律的限制下,使用传统电子设备(如GPU)进行高级AI模型计算的能效正变得不可持续。因此,寻找计算能力与能效之间的平衡成为了一个长期目标。光子计算因其高速低耗特性而受到关注,尽管集成光子技术在推动智能任务执行方面显示出潜力,但其在实际AGI任务中的应用仍受到固有错误限制,以至于只能实现简单任务和浅层模型。

为了支持现代AGI,清华大学自动化系戴琼海院士、方璐副教授合作设计了光子芯片太极(Taichi)——基于集成衍射-干涉混合设计和通用分布式计算架构的大规模光子芯片组,具有百万级神经元能力和每瓦特160-太赫兹操作(TOPS/W)的能效。Taichi在实验中实现了芯片上1000类别级别的分类(在1623类别的Omniglot数据集中测试准确率为91.89%)和高保真人工智能生成内容,效率提高了两个数量级。Taichi为大规模光子计算和高级任务铺平了道路,进一步开发了光子学对现代AGI的灵活性和潜力。相关成果以“Large-scale photonic chiplet Taichi empowers 160-TOPS/W artificial general intelligence”为题发表在《Science》上,第一作者为Zhihao Xu,Tiankuang Zhou为共同一作。

Taichi:具有分布式计算架构的大规模光子小芯片

Taichi引入了一种基于衍射-干涉混合光子芯片的分布式计算架构,通过将计算资源分布到独立集群并合成子任务来处理复杂任务。其光学计算架构能够以更少的层数实现变换,设计为浅层宽阔,以可持续高效方式扩大计算能力。Taichi芯片通过衍射单元处理大规模数据,使用MZI阵列进行可调特征嵌入,利用光学衍射和干涉的强变形能力。通过全球编码器和解码器的衍射权重训练,实现了对高维数据的有效压缩和信息保留,为不同数据集的AI任务提供支持。

图 1.Taichi:采用分布式计算架构的大规模光子芯片,用于百万神经元片上网络模型

Taichi的构建块和详细结构

Taichi芯片组采用三部分布局:输入衍射编码器(DE)、干涉特征嵌入(IE)和输出衍射解码器(DD),分别负责信息压缩、矩阵乘法和信息解码。通过这一结构,Taichi能够以分布式方式处理复杂任务,将大任务分解为多个小子任务。通过不同的分布式子网,Taichi网络实现了任务的分配和结果的合成,提高了准确率和系统的鲁棒性。此外,Taichi采用非线性计算简化网络内部计算负担,使得独立训练小网络变得更简单。一个特制的芯片上路径合成模块用于综合不同路径的输出,以提高分类的准确性。

图 2. 构建 Taichi 的示意图

用于 1000 类分类的片上光子计算

作者开发了由多个独立路径组成的可扩展Taichi系统,适用于通用分类任务。以CIFAR-10为例,至少需要四个路径进行10类别分类。通过采用二进制决策和基于最小欧几里得距离的最终决策,Taichi能够高效处理分类任务。实验证明,通过增加路径数,即使在物理网络深度有限的情况下,也能显著提高准确率。通过对比实验,作者发现在保持参数总量相同的情况下,多路径网络的准确率优于传统单路径网络。在进一步的扩展中,通过增加更多路径处理更高级的任务,Taichi展现了在数值计算和实际测试中的高准确率,证明了其在处理复杂分类任务中的潜力和效能。

图 3. 用于 1000 类分类的大规模光子小芯片

用于生成多功能内容的片上光子计算

Taichi可用于多模态的内容生成,如音乐和图像,克服了现有光子网络在规模和输出限制方面的挑战。音乐生成通过视每个音符生成为分类问题,结合MCMC方法优化风格,成功模拟了巴赫风格的音乐。图像生成方面,Taichi通过不同尺度的纹理生成实现了风格化图像,并通过预训练的VGG-16网络验证了风格分类结果。此外,通过字体风格转换实验,Taichi证明了其在模仿艺术风格及提取图像中高级语义信息方面的能力。

图 4. 用于生成多种内容的大规模光子小芯片

小结

本文设计了Taichi——一个灵活的大规模光子AI芯片,通过并行光子连接提高计算效率。未来,利用直接激光写入和相变材料,实现权重的可重配置,增强系统灵活性。此外,通过技术整合,提升系统集成水平。Taichi的分布式计算架构也可用于扩展现有光子集成电路的能力。Taichi展示了光子计算在处理复杂任务中的潜力,有望推动光学计算解决方案的发展,支持AGI的新进展。

来源:高分子科学前沿

声明:仅代表作者个人观点,作者水平有限,如有不科学之处,请在下方留言指正!