编辑推荐:
本文介绍了一种新型热力学计算机设计,能够利用热涨落在指定观测时间执行任意非线性计算。研究人员通过构建具有四次势的热力学神经元,组建了类似神经网络的结构,解决了传统热力学计算依赖平衡态、计算功能受限的问题。该研究实现了93%的MNIST分类准确率,为热力学计算开辟了非平衡态非线性计算的新范式。
在传统计算领域,热涨落一直被视为需要克服的障碍,而在新兴的热力学计算领域,这些随机波动反而成为计算的动力源泉。传统热力学计算机主要依赖系统的平衡态特性,通过玻尔兹曼分布来编码计算任务,这种方法虽然巧妙,但存在两个根本性限制:一是系统达到热平衡需要时间,且弛豫时间可能因程序不同而有数量级差异;二是并非所有计算都能通过平衡态特性直观表达,例如矩阵求逆计算要求矩阵必须是正定的。
Stephen Whitelam和Corneel Casert在《Nature Communications》上发表的研究突破了这一局限,他们设计了一种能够在非平衡态下工作的非线性热力学计算机。这种新型计算机不依赖于系统是否达到热平衡,而是通过训练使其在指定观测时间输出目标计算结果,从而实现了真正意义上的通用非线性计算能力。
研究团队采用的关键技术方法包括:构建基于四次势的热力学神经元模型,使用朗之万动力学模拟系统演化,开发高效的GPU并行计算框架,以及采用遗传算法对网络参数进行优化训练。特别值得一提的是,他们通过重置采样和序列采样两种模式收集系统输出,确保了计算的可靠性。
研究结果部分,作者通过多个精心设计的实验验证了热力学神经网络的强大功能:
在"热力学神经元"部分,研究展示了单个神经元在不同势能配置下的响应行为。当神经元势能为纯二次型时,其平衡态激活函数呈线性关系,限制了网络的表达能力。而引入四次势后,神经元在有限时间内的响应呈现出显著的非线性特性,这是实现通用逼近能力的基础。研究人员最终选择了J=(1,0,1)的参数配置,既保证了非线性特性,又有效抑制了热涨落带来的噪声。
在"热力学神经网络"部分,研究团队构建了分层网络结构,其中包含自相互作用项和神经元间的双线性耦合项。与传统的深度神经网络不同,这种设计允许信息在层间双向流动,增强了网络的表达能力。通过重置采样策略,他们能够并行收集多个独立轨迹的样本,显著提高了计算效率。
在"编程热力学计算机"部分,研究演示了如何训练网络逼近复杂非线性函数。当目标函数为y0(z)=cos(2πz)时,具有非线性神经元的网络能够快速学习并准确逼近该函数,而线性网络则完全失败。值得注意的是,训练后的网络仅在指定的观测时间tf=1时输出目标函数,在平衡态下的表现反而与目标存在较大差异,这凸显了非平衡态操作的重要性。
在"机器学习应用"部分,热力学计算机在MNIST手写数字分类任务中取得了93%的测试准确率。虽然这一结果不及当前最优方法,但显著优于线性分类器,证明了其在实际问题中的实用性。研究人员还发现,训练后的网络对噪声强度具有一定鲁棒性,在J=kBT到J=10kBT的能量尺度范围内都能保持良好性能。
研究结论与讨论部分强调,这项工作将热力学计算从平衡态的"玻尔兹曼计算机"拓展到了非平衡态的"朗之万计算机"范畴。通过引入非线性势能,热力学神经元获得了类似人工神经元的激活特性,使得网络具备通用函数逼近能力。这种设计不仅解决了平衡态计算的局限性,还为物理计算系统提供了新的实现途径。
该研究的重要意义在于:首先,它打破了热力学计算必须依赖平衡态的固有范式,证明了非平衡态操作的优势;其次,提出的热力学神经元设计简洁通用,可采用非线性RLC电路或超导约瑟夫森结等现有硬件实现;最后,训练方法具有硬件兼容性,可以直接在实验系统中继续优化参数。
这项研究为热力学计算开辟了新的发展方向,将随机性从需要克服的挑战转化为计算资源,为实现低功耗、高并行的物理计算系统奠定了重要基础。随着进一步的研究,这种基于热涨动的计算范式有望在边缘计算、物联网等场景中找到重要应用。