磁性随机存取存储器架构或助力边缘物联网
过去十年间,有两个宽泛的技术领域一直在不断加快发展的步伐:人工智能(AI)和物联网(IoT)。
凭借在数据分析、图像识别以及自然语言处理等任务中的出色表现,人工智能系统在学术和工业环境中已成为不可否认的强大工具。
同时,电子设备的小型化以及相关技术的进步,大幅缩小了能够连接互联网的功能设备的尺寸。工程师和研究人员都预见到了一个物联网设备无所不在的世界,而这构成了高度互联世界的基础。
然而,将人工智能能力引入物联网边缘设备带来了重大挑战。人工神经网络(ANNs)——作为最重要的人工智能技术之一——需要大量的计算资源,而物联网边缘设备本身很小,功率、处理速度和电路空间有限。开发能够在边缘设备上高效学习、部署和运行的人工神经网络是一个主要障碍。
对此,来自东京理科大学的高原隆之教授和藤原裕也正在努力寻找应对这一挑战的巧妙解决方案。在他们于 2024 年 10 月 8 日在《IEEE 接入》上发表的最新研究中,他们为一种称为二值化神经网络(BNN)的特殊类型的人工神经网络引入了一种新颖的训练算法,以及在适用于物联网设备的前沿的内存计算(CiM)架构中对该算法的创新实现。
“BNN 是仅使用 -1 和 +1 的权重和激活值的人工神经网络,它们可以通过将信息的最小单位减少到仅一位来最小化网络所需的计算资源,”高原解释道。
“然而,尽管在推理期间权重和激活值可以存储在单个位中,但在学习期间权重和梯度是实数,并且在学习期间执行的大多数计算也是实数计算。因此,在物联网边缘侧一直难以给 BNN 提供学习能力。”
为了克服这一问题,研究人员开发了一种名为三值梯度 BNN(TGBNN)的新训练算法,有三个关键的创新之处。首先,他们在训练期间采用了三值梯度,同时保持权重和激活值为二进制。其次,他们增强了直通估计器(STE),改进了梯度反向传播的控制,从而确保高效学习。第三,他们采用了一种概率方法,通过利用 MRAM 单元的行为来更新参数。
随后,研究团队在 CiM 架构中实现了这种新颖的 TGBNN 算法——这是一种现代设计范例,在其中计算直接在内存中进行,而非在专用处理器中进行,以此节省电路空间和功率。为了实现这一点,他们开发了一个全新的 XNOR 逻辑门作为磁性随机存取存储器(MRAM)阵列的构建块。这个门通过磁性隧道结把信息存储在其磁化状态中。
为了改变单个 MRAM 单元的存储值,研究人员利用了两种不同的机制。第一种是自旋轨道转矩——当电子自旋电流注入材料时产生的力。第二种是电压控制的磁各向异性,这是指对材料中不同磁态之间存在的能垒的操纵。由于这些方法,求和积计算电路的产品尺寸减小至传统单元的一半。
该团队借助 MNIST 手写数据集,对他们所提出的基于 MRAM 的 BNN 用 CiM 系统的性能进行了测试,此数据集涵盖了人工神经网络需要识别的单个手写数字的图像。
“结果显示,我们的三值梯度 BNN 借助基于纠错输出码(ECOC)的学习,达成了超过 88%的准确率,同时和具有相同结构的常规 BNN 的准确率相匹配,并且在训练过程中实现了更快的收敛。”川原说道。
我们坚信我们的设计会让边缘设备上的 BNN 更具效率,保持其学习和适应的能力。
这一突破或许能为能够更大程度地利用人工智能的强大物联网设备铺平道路。
这对众多快速发展的领域有着显著影响。比如,可穿戴健康监测设备能够变得更高效、更小、更可靠,无需一直连接云就能运行。同样地,智能房屋将可以执行更复杂的任务,并且以更灵敏的方式运转。