《Neural Networks》:A Cortico-Cerebellar Neural Model for Task Control under Incomplete Instructions
编辑推荐:
生物启发的皮层-小脑协同模型通过分层架构实现低输入依赖的机器人运动控制,在动态扰动环境中展现优异适应性和自主性。
崔兰云|余颖|王青云|陈冠荣
北京航空航天大学动力学与控制系,中国北京 100191
摘要
受小脑启发的运动控制系统在机器人技术中得到了广泛研究,以实现生物学上合理的运动生成。然而,大多数现有模型在训练过程中严重依赖高维指令输入,这与生物系统中观察到的高效输入控制方式存在差异。在人类中,有效的运动学习通常基于稀疏或不完整的外部反馈。这可能归因于多个大脑区域之间的相互作用,尤其是大脑皮层与小脑之间的相互作用。在这项研究中,我们提出了一个分层的大脑皮层-小脑神经网络模型,该模型研究了在指令不完整或维度较低的情况下实现运动控制的神经机制。通过两个互补的评估指标进行评估的结果表明,该模型在减少对外部指令依赖的同时,没有牺牲轨迹的平滑性。该模型的特点是功能分工明确:大脑皮层网络负责高级动作选择,而小脑网络通过扭矩控制执行运动指令,直接作用于平面手臂。此外,大脑皮层的探索能力得到了小脑扭矩控制的随机特性的间接增强。我们的研究结果表明,即使指令信号稀疏,大脑皮层-小脑的协调也能实现稳健和灵活的控制,这揭示了生物系统在信息受限条件下实现高效行为的潜在机制。
引言
受大脑启发的控制是控制科学与神经科学交叉领域的一个前沿课题,它有可能超越传统控制系统的局限性。人类在控制策略上的优越表现表明,人类神经系统是设计控制系统的理想参考框架。因此,模仿神经机制以提高控制性能已成为克服当前技术瓶颈的一个有前景的方向(Hu等人,2022;Qiao等人,2022,2023;Zhang等人,2020)。例如,研究表明,将典型的神经回路结构纳入传统的脉冲神经网络架构可以显著提高学习效率(Shen等人,2023)。这些发现强调了探索生物神经机制以解决智能控制关键挑战的科学价值。
受小脑启发的控制模型已成为神经形态控制领域的一个关键研究方向。作为生物运动调节的中心,小脑整合了大脑皮层的运动指令、脊髓调节信号和周围感觉反馈,从而在运动的启动、规划和执行阶段实现精确的多层次调节(Glickstein,2007)。Marr–Albus–Ito理论框架基于小脑的微电路,提出了在攀爬纤维(CF)输入指导下,平行纤维(PF)-浦肯野细胞(PC)突触的突触可塑性模型。这一理论创新不仅加深了对条件反射神经基础的理解,还为运动控制理论的发展提供了计算范式(Kawato等人,2021)。
基于这一理论的控制模型在多模态运动场景中显示出显著优势。在机器人臂控制领域,利用脉冲时序依赖性可塑性(STDP)的小脑启发式神经网络架构成功实现了精确的扭矩调节,在动态干扰环境中表现出卓越的适应控制能力。在一些研究中,其轨迹精度超过了传统的工业级位置控制算法(Abadia等人,2021)。
目前关于小脑建模的研究主要集中在特定神经核的生物物理特性及其在运动控制中的功能作用上。然而,值得注意的是,受小脑启发的控制架构往往对外部完整输入有很高的依赖性——即小脑控制器执行每一步动作后都需要外部反馈。这种输入依赖性构成了一个严格的要求;然而,大多数现实世界场景无法满足这一严格标准,从而大大限制了其实际应用性。
从大脑的角度来看,人类能够在指令不完整和反馈有限的情况下高效执行复杂任务——我们假设这种能力源于多个大脑区域的协同工作。减少输入依赖性是实现有效控制的关键步骤。开发生物学上合理的模型来研究人类在低指令条件下执行任务的神经机制是一个有前景的方向。然而,大多数现有的受大脑启发的模型仅关注孤立的大脑区域,缺乏对跨区域相互作用的有效整合,限制了它们捕捉人类运动控制背后协同动态的能力(Chadderdon等人,2012;Dura-Bernal等人,2017;Kim等人,2017;Neymotin等人,2013;Teka等人,2017;Wei等人,2020)。尽管之前的研究尝试构建多大脑区域耦合模型,但这些设计概念大多停留在神经生理现象的表征层面,未能阐明多尺度神经合作如何改善输入依赖性的基本机制(Todorov等人,2019)。
基于上述研究空白,并结合广泛的生理学研究(包括大脑皮层与小脑之间的双向连接(Middleton & Strick,2001;Schmahmann,2001;Hansel等人,2001;Hosp等人,2011;Ito,1970;Kitazawa等人,1998;Yagishita等人,2014)以及它们之间的功能支持(Abadia等人,2021;Carrillo等人,2008;Thoma等人,2008;X. Wang等人,2025),我们建立了一个生物学上合理的大脑皮层-小脑模型。该模型扩展了传统的小脑模型,探讨了多大脑区域耦合在内部模型训练过程中调节输入依赖性的调节作用,有可能克服单一大脑区域方法的固有局限性。这一研究范式不仅符合神经系统分层处理的基本原则,还为构建具有低输入依赖性的真正生物学上合理的控制架构提供了理论支持。
在交互方面,大脑皮层网络通过前馈连接指导小脑网络进行动作选择,而小脑网络采用受生物力学约束的扭矩控制机制,鼓励大脑皮层进行更全面的探索。本研究的核心在于分析大脑皮层-小脑相互作用如何实现低输入依赖性的运动控制:大脑皮层的决策层通过轨迹复现,显著降低了小脑执行层对外部反馈信号的实时依赖性。这种弱输入依赖性在干扰环境中特别有利,通过多大脑区域的协作实现了通用适应性。
在提出的小脑学习模型(Abadia等人,2021;Carrillo等人,2008)的基础上,本研究整合了多巴胺介导的大脑皮层强化学习机制(Goldman-Rakic等人,1989;O’Doherty等人,2015;Samson等人,2010)。由此产生的模型表现出探索能力,能够不断优化实现目标所需的实际运动序列,同时减少对任务完成条件的依赖性。该模型在引导机器人臂跟随目标轨迹方面表现出色,无论是在力干扰还是镜像干扰条件下。研究表明,对于目标导向任务,大脑皮层-小脑协作架构为机器人臂提供了比依赖单一输入的传统小脑控制系统更高的环境适应性和运动自主性。从“受大脑启发”的角度来看,这一模型代表了小脑启发式控制算法的更高层次尝试。它提供了一种推测性的方法来管理大脑内部的协作,灵活地控制连续的手臂运动。此外,它还提出了一个假设,解释了人类在模糊运动指令下完成任务的潜在机制,揭示了多模态神经调节在不确定环境中的补偿作用。这项研究为下一代自适应智能控制系统的开发奠定了基础。
章节摘录
决策步骤
我们的目标是通过将大脑皮层网络纳入标准的小脑模型来探索该模型的类大脑效应。大脑皮层网络的主要功能是使用奖励信号探索期望的轨迹,而小脑网络则利用基于误差信号的监督学习来执行大脑皮层探索的轨迹。
为了使机器人的末端执行器能够跟随期望的轨迹,机器人的两个关节(肩部和肘部)必须
目标转换模拟
首先进行的行为模拟是目标切换模拟,旨在展示大脑皮层-小脑模型的灵活性。在这个实验中,机器人的目标轨迹突然改变,使我们能够观察模型的适应行为、探索和纠正过程。
第一个期望的轨迹是工作空间中的一个圆:
第二个期望的轨迹是一个8字形轨迹:
本研究的主要贡献
本研究的主要贡献体现在两个方面:神经机制探索和性能提升。在机制探索方面,本研究探讨了人类如何用更少的外部输入完成任务。通过将大脑皮层网络与小脑控制器相结合,我们超越了将小脑视为被动执行器的传统观点。由此产生的大脑皮层-小脑相互作用使系统能够推断和补充缺失的信息,展现出神经动态
结论
总之,所提出模型的贡献包括机制探索和性能提升。我们的模型通过整合探索能力扩展了传统的小脑模型,表现出灵活性和稳健性。由于其区域间的相互作用,该模型能够在抽象和稀疏的评估反馈下成功完成任务。我们的模型为传统小脑模型的更智能扩展提供了途径。
作者贡献
所有作者共同设计了研究,进行了数据分析,并撰写了论文。
数据可用性
由于本研究没有创建或分析新的数据,因此不适用数据共享。
CRediT作者贡献声明
崔兰云:撰写——原始草稿,可视化,验证,方法论,调查,概念化。余颖:撰写——审阅与编辑,监督,调查,概念化。王青云:撰写——审阅与编辑,监督,资源获取。陈冠荣:撰写——审阅与编辑。
利益冲突声明
作者声明,本研究是在没有任何可能被视为潜在利益冲突的商业或财务关系的情况下进行的。
致谢
本研究得到了国家自然科学基金(批准号:12332004, 11932003)的支持。