可转移的多层次时空图神经网络在自适应多智能体轨迹预测中的应用

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Knowledge-Based Systems》：Transferable Multi-Level Spatial-Temporal Graph Neural Network for Adaptive Multi-Agent Trajectory Prediction

【字体：大中小】 时间：2026年02月02日 来源：Knowledge-Based Systems 7.6

编辑推荐：

　　
随着智能交通系统和自动驾驶技术的快速发展，多智能体轨迹预测的准确性直接关系到交通系统的安全性和效率。当前基于深度学习的轨迹预测方法在跨域场景中普遍面临两大核心挑战：其一，不同数据集的时空特征分布存在显著差异，导致传统对偶域对齐方法难以捕捉细粒度动态特征；其二，多智能体交互中的行为模式异质性使跨数据集迁移学习效果受限。针对这些问题，研究者提出了一种融合多层次时空特征建模与动态分布对齐的迁移学习框架，其创新性体现在三个维度。

在理论方法层面，研究者突破了传统最大均值离散度（MMD）的局限。传统MMD仅关注均值层面的分布差异，而提出的窗口化均值梯度离散度（WMGD）指标通过滑动窗口机制，同步捕捉了轨迹序列的均值分布和梯度变化特征。这种设计能够有效建模时空特征在时间维度上的相位演化规律，特别是在交通场景中车辆加速度突变、路径急转弯等动态特征的表现更为显著。实验表明，相较于传统对齐方法，WMGD在跨域数据特征匹配方面具有27.8%的误差优势，这主要得益于其引入的梯度统计量对特征动态变化的敏感性增强。

模型架构方面，研究者构建了具有双层级特征提取机制的时空图神经网络。底层网络独立处理历史轨迹的时空特征，通过分层特征融合机制实现从个体运动模式到群体交互特征的递进式建模。具体而言，第一级网络采用双向LSTM结合图卷积操作，分别建模个体轨迹的历史动态和空间拓扑关系；第二级网络引入跨层注意力机制，在时空维度进行特征交互增强。这种分层设计既保证了单域内的高精度预测（实验显示基础模型在单域RMSE可降至0.35），又通过通道注意力机制自适应调整跨域特征权重，有效解决了多源数据异构性问题。

在跨域适应策略上，该框架创新性地将动态对齐机制嵌入模型训练全过程。传统方法通常将域对齐作为预处理步骤，而本方案通过联合优化对齐损失与预测损失，实现了端到端的动态适应。特别地，在特征表达层设计了域不变性约束模块，通过对抗性训练保持关键时空特征在跨域场景中的稳定性。这种深度融合策略使得模型在源域（如高速公路场景）和目标域（如交叉路口场景）之间的迁移效率提升显著，实测数据显示跨域预测误差降低幅度达到传统方法的1.8倍。

实验验证部分采用了两个具有挑战性的公开数据集：inD数据集包含200万条高精度轨迹，覆盖城市道路、高速公路等多种场景；INTERACTION数据集则重点考察多智能体交互下的轨迹不确定性。在交叉域测试中，T-MLSTG模型在轨迹终点预测（T=12时刻）的RMSE为0.812，较基准模型降低31.7%。在跨数据集迁移测试中，模型通过预训练阶段迁移的时空特征权重，使目标域预测误差均值降低27.8%，特别是在复杂交互场景（如四车交叉路口的竞速避让行为）中表现尤为突出。

值得注意的是，该方案在特征对齐过程中引入了动态时窗机制。通过自适应调整窗口大小，模型能够有效捕捉不同场景下轨迹变化的动态特征。例如在高速公路场景中，采用较大窗口（τ=5-8）以保留长尾驾驶习惯；而在城市交叉路口场景中，较小窗口（τ=3-5）则能更好捕捉紧急避让等瞬时行为。这种动态调整机制使得模型在域差异较大的场景中仍能保持稳定的迁移性能。

模型的可解释性设计也是一个亮点。通过构建特征可视化系统，研究者发现通道注意力机制能够显著提升关键交互特征（如车流密度、目标加速度）的权重分配。在数据稀疏场景下，该机制通过增强高阶交互特征的表达能力，有效弥补了标注数据不足带来的信息损失。例如在低流量交叉路口，模型通过强化邻近车辆的轨迹关联性预测，将错误率降低了19.3%。

研究团队在实验设计上体现出严谨性。除常规RMSE指标外，特别引入了轨迹相似度指数（TSI）和交互误差熵（IEE）两个评估维度。TSI通过计算预测轨迹与真实轨迹的形状相似度，有效评估了模型的动态预测能力；IEE则量化了多智能体交互行为的建模精度。结果显示，在交互误差熵指标上，T-MLSTG较现有最优模型提升42.7%，这表明其更完善的群体行为建模能力。

作者贡献部分体现了研究工作的系统性。通讯作者负责理论框架构建和模型优化，第一作者主导实验设计与结果分析，数据采集由资源团队完成。这种分工协作模式既保证了技术路线的连贯性，又通过多学科交叉提升了研究的全面性。研究还特别考虑了实际部署中的计算效率问题，通过轻量化网络设计和并行计算优化，使得模型在NVIDIA A100 GPU上的推理速度达到32帧/秒，满足实时交通决策的需求。

未来工作方面，研究者计划将该方法扩展至非结构化交通场景（如乡村道路、城市高架桥），并探索多模态数据融合（如天气、光照信息）。技术改进方向包括开发自适应动态网络架构，以及引入联邦学习机制解决数据隐私问题。这些扩展将进一步提升模型在真实交通环境中的泛化能力。

综上所述，该研究从理论方法、模型架构、实验设计三个层面构建了完整的跨域迁移学习框架。其创新性不仅体现在对传统MMD指标的改进，更在于通过多层次时空特征建模实现了从个体到群体的递进式知识迁移。实验数据充分证明了该方案在解决跨域数据分布偏移和跨数据集行为异质性方面的有效性，为智能交通系统的实际应用提供了可靠的技术支撑。该成果的提出，标志着多智能体轨迹预测研究在迁移学习方向的重要突破，为后续研究奠定了方法论基础。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号