
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CoT-Drive:利用大语言模型(LLMs)和思维链提示技术实现自动驾驶的高效运动预测
《IEEE Transactions on Artificial Intelligence》:CoT-Drive: Efficient Motion Forecasting for Autonomous Driving With LLMs and Chain-of-Thought Prompting
【字体: 大 中 小 】 时间:2026年02月03日 来源:IEEE Transactions on Artificial Intelligence CS6.4
编辑推荐:
准确运动预测是自动驾驶安全决策的核心,本研究提出CoT-Drive方法,通过大语言模型(LLMs)与链式思考(CoT)技术结合,采用教师-学生知识蒸馏策略优化轻量级语言模型(LMs),使其在边缘设备实现实时运行。研究构建highway-text和urban-text新数据集,实验表明该方法在五个真实数据集上预测准确率显著提升,首次实现LLMs在自动驾驶中的实际应用。
在动态且异构的环境中,对交通参与者的精确运动预测是自动驾驶车辆(AVs)决策和安全规划的基础,是自动驾驶(AD)系统的核心[1]、[2]。这些环境需要能够有效理解上下文语义信息的运动预测模型,包括各种参与者(如车辆、行人和骑自行车者)的运动和行为,以及交通信号和道路条件等环境因素,还有这些实体之间的复杂交互。尽管深度学习模型在运动预测方面取得了最新进展[3]、[4],但它们在未见过的或极端情况下往往表现不佳,暴露出在泛化能力和上下文理解方面的关键局限性。这些数据驱动的模型通常侧重于更常见和简化的场景,在面对与训练数据差异较大的真实世界环境时表现较差。这引发了一个紧迫的问题:我们如何提高这些模型的适应性和鲁棒性?