《SCIENCE ADVANCES》:Electroluminescent perovskite QD–based neural networks for energy-efficient and accelerate multitasking learning
编辑推荐:
本文介绍了一项开创性研究,旨在解决人工智能系统在机器人、医疗和自动驾驶等领域部署时面临的多任务学习能效和速度瓶颈。研究人员利用Cs1?xFAxPbBr3量子点构建了双输出电致发光突触器件阵列,实现了突触后电流(PSC)和突触后电致发光(PSEL)信号的同步处理,并展示了长期可塑性等关键特性。通过整合PSC和PSEL信号路径的更新行为,该多任务学习框架能够同时执行分类-回归和分类-图像重建任务。与传统的组合式单任务框架和基于图形处理器(GPU)的硬件加速器相比,该方法分别实现了高达47.09%和29.17%的计算速度提升,以及高达8.2倍和32.4倍的能耗降低。这为未来节能、高效的并行多任务人工智能硬件系统开辟了新途径。
想象一下,一个机器人在复杂环境中需要同时处理多种感官信息——它既要识别眼前人的种族,又要估算其年龄,甚至还要在内部重建看到的画面,以便做出最优决策。这就像我们人类大脑在日常生活中的表现一样,轻松自如地并行处理多项任务。然而,当前支撑人工智能(AI)的深度神经网络硬件,大多依赖于图形处理器(GPU)或云计算平台,它们在执行多任务时面临着高能耗、高延迟和高成本的严峻挑战。传统的软件多任务学习方法,往往需要为每个任务开辟独立的计算路径,这不仅增加了计算负载和内存操作,也导致了严重的能源浪费。更关键的是,现有的大多数人工突触器件,其学习模式是“单输入-单输出”的,一次只能响应一个刺激、输出一种信号(如电导变化),这使得它们很难像生物大脑那样,用一个突触同时处理并学习多项任务。开发一种能够高效、节能地并行处理多任务的新型神经形态硬件,已成为推动下一代人工智能发展的关键前沿。
针对这一瓶颈,一项发表在《SCIENCE ADVANCES》上的研究带来了突破。研究团队设计并制造了一种基于混合维度Cs1?xFAxPbBr3量子点的电致发光突触交叉阵列。这个器件的神奇之处在于,它能在单一电学输入脉冲的驱动下,同时产生两种不同的输出信号:突触后电流(PSC,一种电信号)和突触后电致发光(PSEL,一种光信号)。这就像是给人工突触装上了“电眼”,既能传递电信号,又能发射光信号。基于这一独特的双输出器件阵列,研究人员构建了一个新颖的多任务学习框架,成功演示了人脸图像的同时年龄预测(回归任务)、种族识别(分类任务)和图像重建任务,在显著提升计算速度的同时,大幅降低了能耗。
为开展这项研究,作者主要运用了以下几项关键技术:首先,他们通过溶液法合成了不同甲脒(FA)离子掺杂比例(0 ≤ x ≤ 0.15)的Cs1?xFAxPbBr3钙钛矿量子点,并利用旋涂工艺在图案化的氧化铟锡玻璃基底上逐层沉积,构建了8x8的交叉阵列突触器件。其次,他们采用高分辨率透射电子显微镜和X射线光电子能谱对材料的微观结构和化学态进行了表征。再者,通过精密的电学-光学同步测量系统,对器件的PSC和PSEL响应进行了全面表征,包括电流-电压特性、配对脉冲易化、长时程增强/抑制等突触可塑性行为。最后,他们利用UTK人脸数据集(包含多种族、多年龄的人脸图像)对所提出的多任务学习框架进行了仿真验证和性能评估。
研究成果
双输出器件的概念与材料特性:
研究人员提出的双输出电致发光突触阵列,其核心构想是模拟机器人人工大脑并行处理多任务的能力。器件采用氧化锌/支化聚乙烯亚胺、Cs1?xFAxPbBr3量子点、聚乙烯咔唑和五氧化二钒的混合维度堆叠结构。通过调控FA+的浓度(x),可以有效调节量子点的晶格常数和电子能带结构,进而改变器件的电学和光学输出特性。阵列中的所有像素都能发出明亮、均匀的绿光,且发光颜色坐标随x值增加而规律变化。
器件的开关与突触特性:
该钙钛矿量子点突触阵列表现出稳定的自整流开关行为。当施加不同参数(电压、脉宽、脉冲数)的输入脉冲时,PSEL的强度可以在523纳米波长处被精确调控,PSC也能对应产生不同的导通/关断电流水平。更重要的是,该器件成功模拟了生物突触的关键特性:1. 配对脉冲易化(PPF),即第二个脉冲引发的响应强于第一个,且这一效应随时间间隔增大而衰减;2. 脉冲频率依赖性可塑性;3. 长时程增强(LTP)和长时程抑制(LTD),即PSC和PSEL的状态可以通过连续的电位脉冲(增强)和抑制脉冲(抑制)进行稳定、可调的模拟更新,动态范围可达~1000个独立状态。这些特性表明该器件具备实现稳健学习过程的能力。
并行多任务学习算法的实现:
研究团队将8x8阵列中每个节点的PSC和PSEL值视为独立的卷积核组件,构建了多任务学习框架。他们设计了两种模型:用于年龄回归和种族分类任务的“多任务-卷积神经网络模型”,以及用于种族分类和图像重建任务的“多任务-残差网络15模型”。其核心策略是通过一个总损失函数来联合优化两个任务,该总损失是各任务损失(如回归损失、分类损失、重建损失)的加权和。通过反向传播算法,同步更新由PSC和PSEL信号共享的卷积核权重以及任务特定的全连接层权重。这种设计使得两个任务能够在一个网络中并行学习,共享特征提取过程。
多任务学习性能评估:
在年龄回归和种族分类任务中,当回归与分类损失比为0.7:0.3时,模型能同时取得较高的年龄预测准确度(R2= 0.749)和种族分类准确度(86.06%),性能与单任务学习相当。在种族分类和图像重建任务中(损失比0.3:0.7),分类准确度达85.61%,重建图像的结构相似性指数(SSIM)达到0.9。研究表明,通过调整损失函数的相对权重,可以在多个任务间取得平衡的最优性能。
能耗与速度优势分析:
该多任务学习框架展现出显著的效率优势。为实现相同的性能,多任务学习所需的训练周期数比将两个单任务简单组合的“组合式单任务”框架分别减少了47.09%(年龄/种族任务)和29.17%(种族/重建任务),意味着计算速度的加速。在能耗方面,基于该双输出突触器件的向量矩阵乘法能耗,相较于传统的GPU硬件加速器,在“组合式单任务”模式下可降低3.5至13.1倍,而在多任务学习模式下,能耗降低幅度进一步扩大到8.2倍和32.4倍。这主要得益于该架构避免了GPU中频繁且高能耗的数据移动(缓存和主存访问)。此外,在权重(核)更新过程中,多任务学习相比“组合式单任务”也实现了约2倍的能耗降低。
结论与展望
本研究成功开创了一种基于混合维度Cs1?xFAxPbBr3量子点的交叉阵列,用于实现节能且加速的多任务学习。该创新器件能够同步处理PSC和PSEL信号,并展现出包括PPF、脉冲频率依赖性可塑性和LTP/LTD在内的关键突触可塑性特征。通过整合PSC和PSEL信号的更新过程,所构建的多任务学习框架能够在人脸图像上并发执行回归-分类和分类-图像重建任务。与组合式单任务框架相比,该框架在保持相当性能水平的同时,将计算速度提升了最高47.09%,并将能耗相较于GPU硬件加速器降低了最高32.4倍。这种协同利用电学和光学突触输出的学习过程,相比传统的单输出神经网络展现出巨大优势,为未来可扩展、实用的多任务神经形态计算系统奠定了坚实的基础。