综述：体育医学中的人工智能：面向未来运动医师的以决策为中心的框架

《Diagnostics》：Artificial Intelligence in Sports Medicine: A Decision-Centered Framework for the Future Sports Physician Stefano Palermi, Rita Pucciatti, Nor-Eddine Regnard, Ali Guermazi, Fabiano Araujo, Andrea Demeco, Yosra Mekki, Giuseppe D’Antona, Alessia Guarnera and Marco Vecchiato + 2 authors

【字体：大中小】 时间：2026年05月11日 来源：Diagnostics 3.3

编辑推荐：

　　背景：人工智能（AI）正快速变革医疗保健领域，其在体育医学中的应用持续增加。机器学习（ML）、深度学习（DL）和计算机视觉的进步使得针对来自影像学、可穿戴传感器、表现监测系统和电子健康记录的大规模异质数据集的分析成为可能。尽管这些技术为提升损伤预防、诊断准确性

背景：人工智能（AI）正快速变革医疗保健领域，其在体育医学中的应用持续增加。机器学习（ML）、深度学习（DL）和计算机视觉的进步使得针对来自影像学、可穿戴传感器、表现监测系统和电子健康记录的大规模异质数据集的分析成为可能。尽管这些技术为提升损伤预防、诊断准确性、康复监测和临床决策提供了机遇，但其融入运动员照护的过程仍具复杂性和场景依赖性。方法：本研究对PubMed/MEDLINE数据库开展结构化叙述性综述，以识别体育医学中具有临床相关性的AI应用。检索聚焦于损伤风险预测、肌肉骨骼成像、康复监测、重返运动评估、表现管理和临床工作流程支持等关键领域。通过对原创研究、综述、方法学报告及监管文件的证据进行定性综合，概述当前应用、方法学局限性和决策层面的影响。结果：AI在体育医学的多个领域中展现出日益增强的效用。机器学习模型能够识别训练负荷、生理反应与损伤风险之间复杂的非线性关系，但其预测性能差异较大，常受限于数据集异质性和缺乏外部验证。在肌肉骨骼成像领域，基于AI的算法支持异常自动检测与量化，其在特定任务中的表现接近专家阅片者，但仍具有任务特异性和场景依赖性。新兴应用包括通过可穿戴传感器和计算机视觉系统进行运动分析与康复监测，以及为重返运动决策和临床工作流程优化提供数据驱动支持。然而，现有证据凸显了若干重要局限，包括算法偏倚、泛化能力有限、可解释性差，以及在复杂临床决策场景中误用的风险。结论：AI很可能成为体育医学中的重要决策支持层，通过实现数据整合与纵向监测发挥作用。但模型性能并不必然转化为临床结局的改善，且AI生成的预测仍具有概率性和场景敏感性。因此，临床决策——尤其是重返运动等高利害流程——需要将AI输出纳入更广泛的临床框架中进行结构化整合。运动医师始终作为“人在回路”的整合者处于核心地位，负责将AI衍生信息进行场景化处理，降低潜在误差，并确保运动员管理的安全性与个体化。

1.
引言

人工智能（AI）正逐步重塑现代医疗保健，拓展了诊断、监测、风险分层、治疗个性化和患者参与的能力。除提升效率或自动化常规任务外，AI日益影响医疗决策背后的认知过程，改变临床医生解读复杂数据、管理不确定性以及将证据整合到实践中的方式。体育医学是AI驱动技术落地的极具挑战性的场景，该领域的临床决策常具有时效性要求，且需要整合来自可穿戴设备的生理信号、生物力学与动作捕捉评估、肌肉骨骼影像学以及纵向临床记录等多源异质且持续演化的信息。机器学习（ML）和深度学习（DL）方法适用于应对此类复杂性，可对多模态数据集中的非线性关系建模，并支持超越传统人类模式识别的概率风险评估。然而，这些输出本质上仍具有概率性，若未在临床场景中充分结合场景进行解读，可能被误解或过度依赖。

传统上，运动医师依赖临床检查、对运动员的场景认知和经验判断指导诊疗决策。随着AI系统日益融入损伤风险评估、影像解读、康复监测和表现管理，这一角色正逐步演变。AI并非替代临床专业知识，而是作为额外的分析层，支持复杂运动员数据的整合与纵向解读。这种转变带来了新的挑战，包括算法输出驱动的不当决策风险、在不同运动人群中的泛化能力有限，以及需要在数据驱动洞察与临床推理、运动员特异性场景因素之间取得平衡。

尽管AI在体育医学中的应用快速扩展，现有文献仍较为碎片化，主要聚焦于技术性能指标和单领域应用，对AI输出如何整合到真实世界临床决策中的关注有限。尤其缺乏关于概率模型输出应如何指导高利害决策（如重返运动（RTP））的结构化框架，这类决策中不确定性、风险耐受度和场景因素发挥核心作用。

在此背景下，本叙述性综述探讨AI在体育医学非心血管领域的应用，聚焦损伤预防、肌肉骨骼诊断、康复监测、RTP决策、表现优化和临床工作流程支持。本文目的并非单纯提供AI技术的技术概览，而是批判性探讨AI如何重塑临床推理，识别当前局限性和潜在误差来源，并提出将AI整合到体育医学实践的以决策为中心的视角。特别强调运动医师作为“人在回路”整合者的演化角色，负责将AI衍生输出置于运动员照护的更广泛临床、伦理和运动特异性框架中进行场景化处理。
2.
方法

2.1 研究设计

本文采用结构化叙述性综述方法，综合AI在体育医学临床相关领域的当前应用。由于现有文献在研究设计、人群、数据源、AI方法和结局定义方面存在显著异质性，定量综合或正式证据分级在方法学上不恰当且可能产生误导，因此选择叙述性方法。本综述并非旨在提供算法或性能指标的系统比较，而是分析AI技术如何影响体育医学的临床决策，重点关注运动医师角色的演化与责任。

2.2 研究问题确定

本综述围绕核心研究问题展开：“人工智能如何影响当代体育医学实践中的临床决策和专业责任？”

为回答该问题，文献检索覆盖当前已提出或实施AI工具的关键体育医学领域，包括：损伤风险评估与预防；肌肉骨骼诊断支持；康复监测；重返运动（RTP）决策；表现与负荷管理；临床工作流程与认知支持。据此，本综述采用以决策为中心的框架，聚焦AI衍生输出如何指导体育医学日常实践中的具体临床决策，而非仅评估模型性能。

2.3 纳入标准

纳入标准为：考察AI方法（包括ML、DL、自然语言处理或计算机视觉）在体育医学实践相关领域的应用。研究需涉及以下至少一个领域：运动员损伤风险预测或预防；AI辅助肌肉骨骼成像或诊断；基于AI的康复监测或运动分析；AI支持的RTP评估；表现或负荷监测系统；支持临床工作流程或决策支持的AI应用。排除仅聚焦非运动员普通人群、动物模型或纯粹技术开发且无明确临床适用性的研究。鉴于纳入文献的方法学、验证策略和结局指标存在异质性，未进行正式偏倚风险评价和荟萃分析，而是在综合过程中定性考量证据基础的质量与局限性，重点关注泛化能力、验证策略和潜在偏倚来源。

2.4 信息来源与检索策略

在PubMed/MEDLINE数据库中开展结构化文献检索，识别AI在体育医学中应用的相关出版物。检索覆盖2015年1月至2024年12月，反映过去十年AI方法的快速演进。检索词组合包括：“artificial intelligence”“machine learning”“deep learning”“sports medicine”“injury prediction”“rehabilitation”“return to play”“wearables”“digital health”。通过手动筛选相关综述文章和关键出版物的参考文献列表补充检索。除原创研究外，还纳入系统综述、叙述性综述、方法学研究、共识声明和监管报告，以反映该领域多学科交叉和快速发展的特性。

2.5 研究筛选与数据综合

初始检索得到约1284条记录，去重后筛选1012条。经标题和摘要筛选后，对142篇全文进行合格性评估，最终74项研究纳入定性综合。鉴于本综述的叙述性质以及研究设计、人群和AI方法的显著异质性，未进行正式偏倚风险评价。为提升方法学透明度，基于研究设计、验证策略和临床适用性，对表1和表2纳入的研究赋予解释性证据等级分类，该分类旨在提供务实概览而非正式方法学评价。
3.
体育医学中的转型领域

AI对体育医学的影响不仅源于新技术引入，更在于重塑临床决策的生成、支持和场景化方式。传统方法主要依赖阶段性评估、人群衍生阈值以及损伤与表现数据的回顾性解读。相比之下，AI支持多模态连续数据流整合，推动运动员照护向个体化和动态决策转变。

在体育医学核心领域，AI主要发挥决策支持层的作用，而非自主决策者。通过处理纵向生理、生物力学、影像和行为数据，AI系统生成概率性输出，可为风险分层、诊断解读、恢复监测和RTP评估提供参考。但这些系统的临床相关性不取决于单一算法性能，而在于输出如何在真实世界决策过程中被解读和整合。

重要的是，AI并未消除临床不确定性，而是对其进行了再分配。算法预测本质上具有概率性、场景依赖性，且受限于数据质量、模型设计和外部效度。高预测准确性并不必然转化为临床结局改善，尤其在RTP许可等复杂高利害决策中。对预测分数的误解、对自动化输出的过度依赖以及跨运动人群的有限泛化能力，是AI整合的主要风险。在这一演化范式中，运动医师的角色转向临床整合者，负责将AI衍生输出置于运动员特征、运动项目需求和更广泛伦理考量中进行场景化处理，这些要素无法被计算模型完全捕获。这种整合功能在需要谨慎平衡不确定性、风险耐受度和运动员长期福祉的决策场景中至关重要。

为构建这一转型框架，下文考察AI日益融入体育医学实践的领域。每个领域围绕四个核心问题展开：哪些临床决策得到增强？与传统实践相比AI提供了什么？AI整合带来哪些局限或风险？为何医师监督仍不可或缺？

3.1 风险分层与损伤预防

损伤预防是AI在体育医学中最具临床意义的用途之一，其直接指向核心医疗决策：损伤风险的纵向分层和预防干预实施。传统预防策略依赖回顾性分析、周期性筛查和主观临床判断，常在适应不良的负荷-反应模式形成后才识别出高风险状态。相比之下，AI通过整合动态异质数据流实现连续个体化风险画像，支持更早、更具适应性的预防策略。从临床视角看，AI的核心贡献不在于确定性损伤预测，而在于建模训练负荷、生理反应和组织耐受之间的复杂非线性相互作用。AI系统可整合外部负荷指标（如跑动距离、加速度、跳跃次数）、内部负荷指标（如心率衍生指标和主观疲劳感知）、恢复参数（如睡眠质量）、心理应激和既往损伤史，生成损伤易感性概率估计，而非依赖静态阈值。在此框架下，急性-慢性工作量比、神经肌肉不对称和睡眠紊乱等变量应被视为风险的动态影响因素，而非固定临床截断值。

与损伤预防密切相关的是负荷管理，其临床目标是在最小化损伤风险的同时平衡训练刺激与恢复。AI系统超越描述性监测，可识别偏离运动员个体基线的变化，这些变化可能提示适应不良、过度疲劳或损伤风险升高。通过整合纵向生理、生物力学和心理生理数据（包括心率变异性、感知疲劳、情绪和睡眠质量），这些方法支持对训练反应的更个体化解读。在此背景下，表现优化与损伤预防是同一连续体的相互关联组成部分，训练决策由数据知情的风险估计指导。

实证证据表明，ML模型在损伤预测中可实现中等至较高的区分性能，但结果因运动类型、数据集规模和结局定义差异较大。报告的曲线下面积（AUC）通常在0.70至0.85之间，集成方法在特定场景中常优于传统统计方法。例如，职业棒球和精英运动员队列的大样本分析显示，与传统回归模型相比，纳入多模态数据时预测性能有所提升，但这些发现高度依赖场景，且多来自回顾性数据集。

重要的是，预测性能并不必然转化为临床效用。损伤预测模型常受类别不平衡影响（损伤发生率相对暴露时间较低），可能导致准确率虚高但临床相关的假阳性率。此外，在单一团队或特定竞技环境中开发的模型，在应用于不同人群或运动时外部效度常受限。因此，概率性风险估计必须谨慎解读，并纳入更广泛的临床决策框架，而非作为独立决策工具。

若干额外局限制约了AI损伤风险分层向常规实践的转化。可穿戴平台和监测系统间的数据异质性降低了可重复性，而损伤定义不一致和回顾性数据集中的潜在标签泄露可能进一步损害模型有效性。模型可解释性仍是关键挑战，尤其对于DL架构。尽管SHAP和LIME等可解释AI技术可提供特征重要性见解，但其临床适用性仍有限且需谨慎解读。伦理考量也具有相关性，包括数据所有权、知情同意，以及概率性风险评分在影响训练安排、球队选拔或合同结果的决策中被滥用的风险。

综上，基于AI的损伤风险分层应被视为增强而非替代临床推理的工具。其主要价值在于支持动态风险意识和指导个体化预防策略，同时需承认不确定性、场景和临床判断对安全有效决策的核心作用。

3.2 肌肉骨骼成像中的诊断增强

肌肉骨骼成像是体育医学的核心支柱，为广泛急慢性疾病的诊断、监测和RTP决策提供依据。在此背景下，AI最具临床相关性的贡献在于诊断增强而非替代。AI系统主要提升影像解读的一致性、速度和量化深度，尤其在需要及时和可重复评估的高水平竞技环境中。

从决策视角看，核心问题不仅是是否存在异常，还包括如何检测、量化影像发现并将其整合到运动员纵向管理中。DL模型（最常见为卷积神经网络）在多项肌肉骨骼成像任务中表现出优异性能，包括骨折检测、韧带损伤分类，以及X线、超声、计算机断层扫描（CT）和磁共振成像（MRI）的自动解剖分割。在特定应用中，AI辅助解读已被证明可提高诊断敏感性并缩短阅片时间，尤其在高通量环境如急诊放射学中。例如，针对腕关节和手部X线的AI工具在检测细微或隐匿性骨折方面较标准解读单独使用敏感性更高，支持其作为第二阅片系统减少诊断疏漏的作用。

除检测外，AI日益支持自动定量分析，将影像从描述性模式转变为半定量和纵向监测工具。近期架构可实现MRI和CT上关节间隙狭窄、脊柱排列、肌肉体积、肌腱厚度和软骨形态等参数的自动测量。这些能力在体育医学中尤为重要，因为双侧比较和时间变化常指导康复进展和RTP决策。通过降低观察者间变异并提升测量可重复性，AI辅助成像可支持更标准化和客观的结构恢复评估。

然而，诊断准确性本身并不定义体育医学中的临床效用。结构性异常在无症状运动员中常持续存在，且影像发现不一定与症状、功能能力或重返运动的准备度相关。当前AI系统主要在孤立的影像数据上训练，仍无法整合损伤机制、运动特异性负荷暴露、位置需求、症状演变和康复阶段等关键场景变量，而这些变量对临床决策至关重要。因此，高模型性能并不必然转化为临床结局改善，尤其在RTP许可等复杂场景依赖性决策中。

为提供更结构化的证据概览，表1总结了AI辅助肌肉骨骼成像的代表性研究。如表所示，在骨折检测、膝关节病变分类或加速MRI重建等狭义定义任务中，报告的性能常令人鼓舞；但方法学异质性、有限的外部验证和稀缺的运动员特异性数据集限制了直接比较，降低了对临床泛化能力的确定性。

若干局限进一步制约了AI辅助肌肉骨骼成像向常规实践的转化。许多算法在精选数据集上训练，无法反映真实世界成像方案、扫描仪类型和运动人群的变异性，限制了外部效度。罕见或运动特异性损伤模式代表性不足，且模型在非分布场景中的性能可能下降。可解释性也是挑战，尤其对于DL架构。尽管SHAP和LIME等可解释AI技术可提供特征相关性见解，但其临床整合仍不一致且需谨慎解读。其他障碍包括工作流程整合、成本考量，以及临床医生解读AI输出的培训需求。

如图2所示，AI辅助成像可支持三项互补功能：异常自动检测、结构化报告和影像衍生参数的定量评估。但这些输出仍是中间分析产物而非临床决策，其解读需要与症状、功能发现和运动特异性场景整合。综上，肌肉骨骼成像中的AI应被视为增强诊断一致性和定量评估的决策支持技术，而非诊断或RTP许可的独立决定因素。其临床价值最终取决于是否纳入由运动医师主导的更广泛、场景感知的决策过程。

3.3 康复与功能恢复

康复是体育医学的关键阶段，此阶段的临床决策直接影响恢复质量、再损伤风险和RTP时机。传统康复策略依赖标准化方案、周期性临床再评估和相对粗略的功能里程碑。AI赋能技术正逐步推动这一范式向数据驱动、适应性康复路径转变，基于客观性能指标而非固定时间标准实现连续功能恢复监测和更个体化的进展调整。

从临床视角看，得到增强的关键决策并非单个治疗性练习的选择，而是针对持续功能反馈调节康复负荷、进展和准备度。AI辅助康复系统可整合多模态数据流，包括可穿戴传感器、惯性测量单元、压力传感器和基于计算机视觉的运动分析，量化康复任务中的运动质量、对称性、协调性和负荷分布。这些数据可与心率变异性、主观疲劳、疼痛和疲劳等生理及主观指标结合，生成更精细的动态恢复状态和康复负荷耐受评估。

AI的一个重要贡献在于检测细微代偿策略和神经肌肉不对称，这些可能逃过传统临床观察。通过纵向运动分析，AI模型可识别偏离运动员基线运动模式的异常，支持更早的纠正性干预。这在前交叉韧带重建等复杂损伤后尤为相关，此时尽管临床看似恢复，但生物力学和负荷分布的持续性不对称仍可能存在。

新兴证据支持使用可穿戴衍生的生物力学数据结合ML方法估计组织负荷并监测功能恢复。例如，基于传感器的模型已被用于估计跑步时的胫骨负荷，为组织应力提供代理指标，从而指导负荷进展策略。同时，包含远程监测和自动反馈的数字康复平台在选定的随机研究中显示出与传统物理治疗相当的结果，同时提升了依从性和可及性。但这些结果仍依赖场景，且常来自受控或非精英人群。

重要的是，测量精度或监测能力的提升并不必然转化为临床结局改善。尽管AI系统可增强生物力学缺陷检测和提供连续反馈，但前瞻性证据有限，尚不能证明AI指导的康复策略可降低运动员人群的再损伤率或加速安全RTP。因此，AI衍生输出应被解读为决策支持信号而非规范性建议。

在临床实践中，这些技术在混合康复模型中最为有效，即远程监测补充直接临床监督。AI辅助远程康复可提升依从性、可及性和纵向随访，但负荷进展、重返专项训练和RTP许可等关键决策仍需运动医师的临床判断和场景化解读。

若干局限继续制约广泛实施。许多AI驱动的康复模型基于小型或同质队列开发，限制了跨运动和表现水平的泛化能力。算法输出常不够透明，可能降低临床医生和运动员的信任。可穿戴设备、康复平台和电子健康记录之间的互操作性仍有限，且财务或基础设施障碍可能限制其在精英环境外的可及性。这些挑战凸显了需要稳健的前瞻性验证研究，不仅评估模型性能，还要评估临床影响。综上，康复领域的AI应被视为提升功能评估分辨率和连续性的工具，而非替代临床决策。其主要价值在于支持适应性、个体化康复路径，同时需承认不确定性、场景和临床专业知识对安全恢复和RTP决策的核心作用。

3.4 重返运动决策

重返运动（RTP）决策是体育医学中最复杂和高利害的职责之一，需要整合医疗恢复、功能准备度、心理准备度和运动特异性需求。与诊断或康复决策不同，RTP许可对运动员安全、表现和长期职业生涯轨迹具有即时影响。在此背景下，AI作为决策支持工具，提供客观和纵向见解，但不替代临床判断或专业问责。

从决策视角看，核心问题不是运动员能否重返运动，而是如何在不确定性条件下定义、量化和解读准备度。传统RTP框架依赖时间标准或孤立功能测试，可能不足以捕捉恢复的动态和多维本质。AI方法则利用纵向多模态数据，支持基于恢复轨迹而非预定义时间表的个体化准备度评估。由于专门针对RTP许可的验证AI模型仍然稀缺，表2纳入了可为核心RTP相关的风险分层、功能评估或决策支持框架提供参考的代表性AI和数据驱动研究。

多模态RTP系统可整合来自测力台、可穿戴传感器、动作捕捉技术和经过验证的心理量表的数据，构建全面的准备度画像。常评估的领域包括力量和功率不对称、跳跃和落地力学、关节活动范围、本体感觉控制、运动变异性以及运动员报告的信心或再损伤恐惧。这些整合数据集可检测到孤立临床测试中不明显的功能残留缺陷。

计算机视觉方法进一步扩展了运动分析的可行性，支持通过标准视频记录（包括智能手机采集）实现无标记点运动捕捉。自动视频分析已被证明可识别与再损伤风险或不完全恢复相关的运动不对称和生物力学模式，有可能将生物力学评估扩展到专业实验室环境之外。AI的RTP模型已在多种损伤场景中探索。在前交叉韧带重建中，整合生物力学和功能数据的ML模型显示出识别持续性不对称和建模恢复轨迹的潜力。类似方法已应用于腘绳肌损伤、踝关节扭伤和运动相关脑震荡，纳入疲劳指标、关节负荷模式和运动特异性运动需求以更好地近似真实世界暴露。新兴系统也开始纳入运动项目、场上位置和暴露风险等场景变量，强化了RTP不是固定终点而是场景依赖性临床决策的观念。

然而，模型性能不等同于决策有效性。RTP本质上具有概率性，且AI衍生输出受限于异质输入、不一致的结局定义和有限的外部验证。预测模型可能生成看似精确的准备度分数，却未能捕捉心理准备度、环境应激、团队动态或竞技压力等关键场景因素。这导致算法输出与真实世界决策需求之间存在潜在错配。

从临床角度看，一个关键风险是将定量阈值过度解读为准备度的决定性指标。AI系统可提升测量精度和数据整合能力，但它们并不定义可接受的风险。RTP决策本质上涉及表现、再损伤风险和运动员长期健康之间的权衡，这些权衡无法完全编码到算法模型中。因此，若无适当场景化处理，依赖AI衍生分数可能导致过早或不恰当的重返决策。

因此，AI辅助RTP决策的框架可被描述为三步过程：（1）数据整合与概率风险评估；（2）纳入运动员特异性和运动特异性因素的场景化解读；（3）不确定性下的共享临床决策。在此框架下，AI主要贡献于第一步，而后两个阶段从根本上仍由临床医生主导。

出于这些原因，AI应被视为构建和指导RTP决策的工具，而非自动化许可手段。运动医师仍负责将客观数据与临床检查、运动员报告结局和场景变量整合，确保RTP决策个体化、符合伦理，并与运动员短期和长期福祉保持一致。

除诊断和治疗决策外，AI日益影响体育医学实践的组织和认知维度。在临床环境日益面临行政负担加重和多模态数据流（从成像、可穿戴监测到表现指标和电子健康记录）扩展的背景下，AI驱动工具正被开发用于支持工作流程效率、信息综合和决策一致性。这些技术的首要目标不是替代医师判断，而是保留临床医生的时间和认知资源用于直接的运动员照护。

从临床视角看，得到增强的决策并非医疗推理本身，而是在时间紧迫、数据密集的环境中优先排序、综合和呈现临床相关信息。应用于工作流程优化的AI系统通常依赖自然语言处理实现文档自动化、基于ML的临床决策支持系统（CDSS）实现模式识别和安全性预警，以及多模态数据整合将成像、可穿戴数据、实验室结果

热点排行