LIFT：基于文献信息进行微调的大型语言模型（LLM），实现可解释的卡车驾驶风险预测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《TRANSPORTATION RESEARCH PART C-EMERGING TECHNOLOGIES》：LIFT: Interpretable truck driving risk prediction with literature-informed fine-tuned LLMs

【字体：大中小】 时间：2026年02月17日 来源：TRANSPORTATION RESEARCH PART C-EMERGING TECHNOLOGIES 7.9

编辑推荐：

　　卡车驾驶风险的可解释性预测框架与文献增强LLM方法研究。通过多源数据构建卡车驾驶风险数据集，提出LIFT框架集成LLM推理核心、文献处理流程和结果评估器，验证其较基准模型提升26.7%召回率和10.1% F1分数。利用299篇领域文献构建知识库，LLM可解释性分析显示特征重要性排名与随机森林模型一致，并通过PERMANOVA验证高风险场景变量组合，证明文献增强微调对提升模型可解释性和风险发现能力有效。

肖虎|连元生|李萌|张科|李云轩|苏月龙

清华大学土木工程系，北京，中国

摘要

本研究提出了一个基于文献信息进行微调的可解释预测框架（LIFT LLMs），用于卡车驾驶风险预测。该框架包括一个由LLM驱动的推理核心，用于预测和解释卡车驾驶风险；一个文献处理流程，用于筛选和总结特定领域的文献以构建文献知识库；以及一个结果评估器，用于评估LIFT LLM的预测性能和可解释性。在真实世界的卡车驾驶风险数据集上进行微调后，LIFT LLM实现了准确的风险预测，在召回率和F1分数上分别比基准模型提高了26.7%和10.1%。此外，在由299篇领域论文自动构建的文献知识库的指导下，LIFT LLM生成了与基准模型一致的重要变量排名，并在各种数据采样条件下展示了解释结果的稳健性。LIFT LLM还通过检测卡车驾驶风险中的关键变量组合来识别潜在的风险场景，这些组合通过PERMANOVA测试得到了验证。最后，我们展示了文献知识库和微调过程对LIFT LLM可解释性的贡献，并讨论了LIFT LLM在数据驱动安全研究中的潜力。

引言

卡车驾驶风险对交通安全具有重要意义。虽然卡车在经济发展中发挥着重要作用，但涉及卡车的事故往往具有较高的死亡率并造成巨大的财产损失（Baikejuli等人，2022年；Niu和Ukkusuri，2020年；Zainuddin等人，2023年；Zhou和Zhang，2019年）。在当前的行业实践中，物流公司通过车载设备监控危险驾驶事件（例如，前向碰撞警告），并在这些事件频繁发生时手动监控驾驶员，随后通过电话或其他方法进行安全干预（Zhang等人，2024a）。然而，由于卡车驾驶员通常在隔离环境中长时间工作，实时且有效的监督非常困难。同时，卡车驾驶风险常常受到多种因素的影响，传统的基于频率的风险识别方法无法揭示危险事件的根本原因，使得干预人员难以及时评估驾驶员的状况并采取适当的对策（Baikejuli等人，2022年）。因此，需要一种能够识别卡车驾驶风险因果因素的可解释预测方法。

为了揭示卡车驾驶风险背后的复杂因素相互作用并实现精确预测，研究人员开发了广泛的统计分析方法（Behnood和Mannering，2019年；Hu等人，2025年）、机器学习（ML）方法（Wang等人，2024年；Xue等人，2023年），以及结合统计分析和ML方法优势的集成方法（Jin等人，2023年；Yuan等人，2022年）。然而，这些数据驱动的方法对数据分布非常敏感。由于发现卡车驾驶员在不同交通场景中可能表现出不同的驾驶行为（Hu等人，2025年），当数据收集条件发生变化时，传统数据驱动模型得到的预测和解释结果可能会有显著差异。然而，从尽可能多的交通环境中收集数据往往成本过高。

为了克服数据限制，学者们开始利用预训练的大型语言模型（LLMs）来解决交通预测领域的复杂预测问题（Zhang等人，2025年）。由于LLMs在不同领域的预测任务中表现出强大的泛化能力，发现少量的领域特定数据即可使通用LLM在交通预测问题中表现出色（Li等人，2024年）。此外，与传统的黑盒预测方法不同，LLMs可以使用语义推理来推断数据点背后的信息，从而提高其预测结果的可解释性。例如，LLMs可以根据重复的危险驾驶行为实例识别驾驶员的疲劳状态。然而，通用LLMs在理解特定领域问题时可能会出现幻觉。因此，研究人员将人类构建的研究问题领域知识整合到LLM中，以提供领域概念（Guo等人，2024年；Liu等人，2025a；Xie等人，2025年）。然而，在实际的卡车操作场景中，卡车驾驶风险的影响因素在不同交通场景中表现出高度复杂性和多样性，这很难通过人类专家构建的标准化领域知识库来表述。

正如人类研究人员从先前文献中获取知识一样（图1），LLMs也可以从大量的专业文献中学习领域特定知识，以提高其在相应研究领域的能力。在卡车安全研究领域，研究人员在过去几十年中积累了大量的文献，其中包括从各种交通场景的数据分析中得出的广泛定性和定量结论。因此，先前的文献包含了专家定义的知识库无法捕捉到的信息。由于LLMs在理解长上下文语义数据方面表现出色，因此LLMs可以直接从文献中学习并提高其处理领域任务的能力，例如生成研究想法（Guo等人，2025年）。然而，很少有研究探索利用领域文献增强LLMs在可解释预测任务中的能力。

因此，在这项研究中，我们提出了一个基于文献信息进行微调的可解释预测框架（LIFT LLMs）。如图1所示，该框架使用真实世界的卡车驾驶数据对LLM进行微调，以实现精确的卡车驾驶风险预测。此外，与现有研究不同，现有研究是由人类专家手动定义领域知识库的，我们设计了一个由LLM驱动的文献处理流程，该流程自动从数百篇研究论文中构建领域知识库，从而提高了微调LLM在结果解释方面的能力。借助领域知识库，微调后的LLM可以解释卡车驾驶风险并发现新的知识，如风险场景。

具体来说，我们构建了一个卡车驾驶风险数据集，汇集了实时驾驶行为数据和环境信息（如实时交通速度），利用真实世界的卡车轨迹数据和车载设备检测到的危险事件。通过精心设计的提示模板，我们将卡车驾驶风险数据集转换为基于文本的数据集，并对开源LLM进行了微调。微调后的LLM的预测结果优于基准方法。同时，在领域文献知识库的支持下，基于文献信息的微调LLM通过指出导致高风险轨迹样本中高驾驶风险的关键变量和变量组合来解释驾驶风险。通过计算LLM在数据集中检测到该变量作为关键变量的频率来计算每个影响因素的特征重要性。结果显示，特征重要性的排名与广泛采用的随机森林模型得出的结果一致。此外，LIFT LLM识别出可能导致高卡车驾驶风险的复杂变量组合，这些组合通过PERMANOVA测试得到了验证，突显了LIFT LLM在发现危险交通场景方面的潜力。最后，我们通过与传统数据驱动方法比较，展示了LIFT LLM在结果解释方面的内在稳健性。

本文的主要贡献如下：

•

首先，我们提出了一个基于文献信息进行微调的可解释预测框架（LIFT LLMs），用于卡车驾驶风险预测。该框架包括一个文献处理流程，该流程自动将数百篇领域论文转换为文献知识库，并对LLM进行微调，以实现高能力的卡车驾驶风险预测和解释。

•

其次，利用真实世界的卡车驾驶风险数据集，我们验证了LIFT LLM的预测性能。结果显示，LIFT LLM在召回率和F1分数上分别比基准机器学习模型提高了26.7%和超过10%。

•

第三，通过提示LIFT LLM识别高风险轨迹样本的关键变量和关键变量组合，我们展示了其在结果解释和风险场景发现方面的能力。结果通过基准比较和PERMANOVA测试进行了验证，以检查风险样本和非风险样本之间的变量差异。

本文的其余部分组织如下。第2节回顾了关于卡车驾驶风险预测和LLMs在以往交通安全研究中的应用的相关研究。第3节介绍了所提出的基于LIFT LLM的可解释预测框架的设计。第4节讨论了数据集准备和实验设置。第5节讨论了结果和分析。第6节进一步讨论了LIFT LLM在行业和安全研究领域的潜力。最后，第7节总结了本文并讨论了本研究的局限性和未来研究的方向。

章节片段

卡车驾驶风险预测

为了提高卡车驾驶安全性，研究人员开发了各种模型来预测不同场景下的驾驶风险（Guo，2021年；Ma等人，2023a；Shao等人，2023年）。在不同的卡车驾驶风险中，前向碰撞风险尤其值得关注，因为卡车的质量较大，碰撞事件可能导致严重的损害。现有研究对短期前向碰撞风险预测进行了广泛的研究（Shangguan等人，2023年，

框架设计

所提出的基于LIFT LLM的可解释预测框架如图2所示。该框架由三个组成部分构成。中间是推理核心，它基于微调后的LLM执行卡车驾驶风险的预测和解释。作为推理核心的先前阶段，文献处理流程从领域文献中提取相关研究结论，并为推理核心构建文献知识库。最后是结果评估器

数据描述

在这项研究中，我们根据之前的工作（Hu等人，2025年）通过多源数据聚合构建了一个卡车驾驶风险数据集。我们收集了来自卡车的长期轨迹数据，以及车载设备检测到的前向碰撞警告事件，并将其与Amap提供的实时交通条件数据结合，构建了卡车驾驶风险数据集。数据收集在中国东莞进行，时间从2024年1月4日到2024年3月1日，涉及

任务1：预测性能

在评估中，我们使用1:4的样本比例从测试集中抽取了风险轨迹和非风险轨迹，以符合行业测试标准。随后，我们在包含44个具有前向碰撞风险的轨迹和176个没有此类风险的轨迹的测试集上测试了模型。

LIFT LLM和基准模型在测试集上的整体预测性能如表3所示。LIFT LLM的表现超过了所有

微调过程和文献知识库的贡献

在本节中，我们进一步分析了微调过程和文献知识库对LIFT LLM的贡献，旨在研究这些设计如何增强其解释风险因果关系的能力。具体来说，我们使用所提出的框架来识别在不同设置下导致轨迹样本高风险的最重要因素和变量组合，结果如图11和12所示。

结论

在这项研究中，我们提出了一个基于文献信息进行微调的可解释预测框架（LIFT LLMs）。该框架围绕一个推理核心，其中LLM在真实世界的卡车驾驶风险数据集上进行微调，以实现准确的预测和可靠的卡车驾驶风险解释。此外，该框架还包括一个文献处理流程，用于筛选和总结特定领域的文献以构建文献知识库，以及一个结果

CRediT作者贡献声明

肖虎：撰写——原始草稿、方法论、调查、形式分析、数据管理、概念化。连元生：撰写——原始草稿、可视化、调查、形式分析。李萌：撰写——审稿与编辑、监督、资金获取、概念化。张科：撰写——审稿与编辑、方法论。李云轩：方法论、数据管理。苏月龙：可视化、验证、数据管理。

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系可能会影响本文报告的工作。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号