敏感性分析：教学实用指南

《Risk Analysis》：Sensitivity Analysis: A Practical Guide to Teaching

【字体：大中小】 时间：2026年05月02日 来源：Risk Analysis 3.3

编辑推荐：

　　摘要敏感性分析是一种将模型输出的变异性归因于输入参数和假设中的不确定性的过程。为什么这种技术很重要？在教授敏感性分析时，应该优先考虑哪些方法和概念？哪些教学策略最适合不同的受众？本研究通过总结作者自1999年以来举办的12次暑期学校课程以及为学术界、研究机构和国际组织提供的众

　　摘要

敏感性分析是一种将模型输出的变异性归因于输入参数和假设中的不确定性的过程。为什么这种技术很重要？在教授敏感性分析时，应该优先考虑哪些方法和概念？哪些教学策略最适合不同的受众？本研究通过总结作者自1999年以来举办的12次暑期学校课程以及为学术界、研究机构和国际组织提供的众多专门培训课程的经验，试图回答这些问题。我们的目标是将这些经验提炼成实用的指导方针，为教育工作者和未来的实践者提供方法论基础和教学策略。

1 引言

我们定义“敏感”的方式在建模社区中并不普遍。我们认为一个参数是敏感的，并不是因为它改变了输出数值，而是因为它改变了我们从模型中得出的政策结论（D. Meadows等人，1982年）。

本文通过整合二十多年来教授敏感性分析的经验，并将其转化为风险和不确定性建模的结构化教学框架，为方法论文献做出了贡献。但什么是敏感性分析（SA）呢？这个术语具有相当大的语义灵活性。多年前本期刊给出的一个定义（Saltelli 2002年）是：

“敏感性分析是研究如何将模型输出（无论是数值的还是其他类型的）的不确定性归因于模型输入中的不同不确定性来源。”

敏感性分析在基于模型的决策制定中起着关键作用，因为它通过为模型开发、校准、验证和应用的关键方面提供信息，增强了决策的稳健性和可靠性。它还有助于揭示建模活动中的弱点和盲点。从模型开发者到最终用户，各个层面的利益相关者都可以从它提供的宝贵见解中受益（Saltelli等人，2004年）。在风险分析中，敏感性分析在识别风险指标的主要贡献因素和评估基于风险的决策的稳健性方面发挥着重要作用（Borgonovo等人，2016年；Borgonovo和Plischke，2016年；Clavijo等人，2025年）。值得注意的是，这里的模型可以是计算性的、逻辑性的、概念性的或数据驱动的。由于其多功能性，敏感性分析已经成为一个动态且不断扩展的研究领域（Saltelli等人，2021年），并在几乎所有定量学科中都有实际应用（Razavi等人，2021年）。然而，它仍然出人意料地没有出现在大多数高等教育课程中。因此，当今的绝大多数实践者主要是自学成才的。本研究旨在为研究生和未来的实践者教授敏感性分析奠定基础，提供可操作的指导方针。我们概述了进行敏感性研究的基本步骤，提出了根据具体问题选择适当方法的标准，并通过具体例子来说明概念。本文的结构如下：第2节讨论了敏感性分析在科学学科中的重要性；第3节介绍了基于学习理论的教学框架；第4节介绍了敏感性分析课程的实际结构和内容；第5节概述了预期的学习成果；第6节总结了全文。

2 敏感性分析：为什么它很重要？你会去找一个不使用X光片的骨科医生吗？

正如生态学家Charles Hall所指出的，使用敏感性分析可能是构建模型的主要原因（Hall 2020年）：

“但在我看来，模型的真正优势在于敏感性分析——在那里，我们可以研究模型对那些不精确已知的参数或结构的响应，以及模型组成部分与实际系统的行为比较（即验证）。在建模过程中，彻底的敏感性分析可以显著提高分析的质量及其可传达性。原因有很多。敏感性分析可能会给分析师带来惊喜，提供有时违反直觉的结果：一个预期是输出不确定性的关键驱动因素的因素可能实际上并不重要，或者反之亦然（Saltelli等人，2008年）；一个变量对输出的影响可能与分析师预期的方向相反（Norton 2015年）；可能会出现数值不稳定，导致代码需要修改；可能会发现输入因素之间存在相互作用，即它们通过协同效应对输出不确定性有所贡献（Saltelli等人，1999年），例如，一个因素的效果可能根据其他因素而突然改变（Kozlova等人，2024年）。重要的是，识别不重要的因素是简化模型的一个强大策略。敏感性分析在模型校准和验证中至关重要（Pianosi等人，2016年；Campolongo等人，2007年），因为它可以识别出更有机会被校准的参数。此外，在校准之后，敏感性分析可以通过将校准质量的一些度量作为分析的输出来确定校准不确定性的总体影响。敏感性分析还有助于保护研究不被误证，即通过增强模型的稳健性（Sobo? 1993年）、可信度和透明度（Saltelli 2002年）来证明研究的正确性。在科学研究中，一个重要的挑战是自由度的存在，因为在数据收集和分析过程中做出的决策可能会显著影响研究结果（Breznau等人，2022年）。有限的数据分析可能会掩盖不同合理的数据处理方法可能产生的全部潜在结论。为了解决这个问题，统计学家（Gelman和Loken 2013年）提出了“分岔路径花园”的概念（Borges 1998年）。近年来，引入了多分析宇宙的概念（Steegen等人，2016年）作为处理自由度问题的方法。多分析宇宙技术系统地探索了处理数据的所有合理替代方案，提供了对建模过程更全面和透明的视图。采用这种方法的研究人员使用相同数据的不同版本和替代方法运行所有可能的分析，反映了数据收集、预处理和分析过程中所做的各种选择。这种技术使得可以检查特定结论相对于数据处理的稳健性。多分析宇宙在文献中也被称为“建模过程的建模”（Lo Piano等人，2022年）。实际案例研究（Breznau等人，2022年；Saltelli等人，2024年）展示了敏感性分析如何通过有效探索多维研究决策空间来揭示之前隐藏的不确定性。从某种意义上说，多分析宇宙与全局敏感性分析非常相似，特别是当后者采取建模过程建模的形式时。实际上，这并不是唯一一种与敏感性分析相似的建模不确定性方法。其他例子包括“扰动物理集合”（Bellprat等人，2012年）、“单模型扰动物理集合”（Stainforth 2023年，198年）或扰动参数集合（Rostron等人，2020年）。探索性建模和分析（Kwakkel和Pruyt 2013年）也是如此，在这种分析中，无论输入的变化是否合理，都允许进行广泛的探索，以回答“如果……会怎样”的问题。此外，从关于科学建模哲学的最新手册中对稳健性分析的描述中（Houkes等人，2024年）也可以看出，全局敏感性分析与稳健性分析有相当大的重叠。这种术语的混淆使得当前的敏感性分析教学大纲需要澄清。在讨论使模型负责的战略时，敏感性分析是针对建模者的首要建议之一。例如，在上次COVID-19大流行期间，使用数学模型来评估疫情的传播变得非常明显，甚至向公众展示了这一点，《自然》杂志发表了一份关于“负责任建模”的宣言（Saltelli等人，2020年）。该宣言提出了负责任建模的五个原则：

(i) 注意假设：对输入模型的假设保持透明；
(ii) 注意傲慢：不要使模型相对于输入数据过于复杂；
(iii) 注意框架：明确模型开发者自身的偏见和世界观；
(iv) 注意后果：考虑建模的意外后果；
(v) 注意未知因素：承认有已知和未知的因素会逃出分析范围。该宣言还对用户提出了建议；最重要的是，在接受模型结果之前要求进行敏感性分析（Saltelli等人，2020年）。正如所讨论的，这些考虑不仅适用于严格的数学模型，也适用于所有量化领域，包括模拟建模、统计推断、计量经济学、机器学习、运筹学以及使用不同复杂性的指标。课程旨在通过例子来说明这些概念。可能需要对基于模型的推断进行敏感性分析的主题是无限的，建模的用途也是无限的：敏感性分析可以帮助评估不同温室气体排放情景对未来气候条件的潜在影响（Knutti和Sedlá?ek 2013年）；它可以应用于作物产量模型并优化农业实践（Ruget等人，2002年）；它可以提高复杂流行病学模型的可靠性（Baccini等人，2021年）；在工程学中，敏感性分析有助于在不确定性下优化设计（Saltelli等人，2004年）；在宏观经济学中，敏感性分析可以帮助确定财政政策对经济预测的影响，突出驱动经济结果的关键假设（Borgonovo 2007年），等等，这里无法详尽列举所有情况。风险分析是一个独立的类别，其中敏感性分析用于识别主要的风险驱动因素、模型验证、在不确定性下的决策制定以及缓解策略的规划。敏感性分析在现代复杂安全关键系统的风险分析中发挥着核心作用（Borgonovo等人，2016年；Borgonovo和Plischke 2016年；Clavijo等人，2025年）。在概率风险分析（PRA）模型中，敏感性分析用于识别风险指标的主要贡献因素（例如，系统故障概率或核心损害频率），从而支持缓解措施的优先排序和资源分配。它还通过评估风险结论对认知和参数不确定性的稳健性来帮助模型验证。在安全关键基础设施的设计阶段，如核反应堆（Brown和Zhang 2016年）、航空航天系统（Wang等人，2025年）和能源网络（Yliruka等人，2023年），敏感性分析有助于识别最能有效降低系统风险并提高韧性的参数。历史上，敏感性分析的主要推动力来自核安全社区（Iman和Conover 1980年；Saltelli和Marivoet 1990年；Helton 1993年），特别是通过经合组织的概率系统评估小组在20世纪80年代的工作（Sartori 2014年，95年）。例如，关于冷却剂丧失事故（及相关热液压风险问题）的反应堆安全文献也大量提到了对敏感性分析的需求（NRC Staff 1989年）。全球敏感性分析和不确定性量化的最新发展使得可以通过基于方差的和独立于矩的重要性度量、替代模型以及计算效率高的筛选方法来分析高维工程模拟和复杂基础设施。这些方法已应用于核燃料性能模拟（Ikonen 2016年；Tsanakas和Millossovich 2016年）、可靠性分析以及互连基础设施的韧性评估（Liu等人，2024年），通过识别必须监控或控制的变量来维持系统在可接受的安全范围内（Marchetti等人，2025年）。这些研究者率先使用这些“灰箱”和替代模型来克服传统蒙特卡洛模拟在安全关键背景下的计算负担（Marchetti等人，2025年；Zio 2022年）。其他研究者已经将敏感性分析（SA）的范围从纯粹的概率框架扩展到了更广泛的“风险科学”视角。Aven认为，SA必须考虑支持输入分布的“知识强度”（SoK）（Aven 2020；Glette-Iversen等人2023）。在这种观点下，如果一个系统的风险指标对知识强度较弱的参数高度敏感，那么无论计算出的概率如何，该系统都被认为是脆弱的。这种从基于概率的框架向基于事件、后果和不确定性的框架的转变，确保了SA不仅能够识别统计驱动因素，还能发现可能导致意外事件或“黑天鹅”事件的“基于知识的”脆弱性（Aven 2024）。van Gelder的工作进一步体现了这种多维的SA方法，特别是在物理和海洋基础设施领域。在自主航运的背景下，SA的应用对于量化人为因素和操作因素的变化如何通过事故因果模型传播至关重要，从而识别出最关键的“临界点”，这些临界点会危及航行安全。同样，Van Gelder等人（2004）在海岸防洪设计中运用SA，展示了如何评估基于风险的工程决策对气象和水力数据不确定性的鲁棒性，确保即使在环境条件波动的情况下，安全边际仍然有效。如今，Aven的基础不确定性原则、Zio的先进计算架构以及Van Gelder的实际工程应用相结合，为管理日益自动化和互联的技术环境中的风险提供了一个全面的工具包。Tarantola等人（2024）提供了一个详细的SA发展时间线，追溯了其从局部方法到全球方法的演变过程。也许模型需要SA这种探究性视角的最关键原因是模型本身是脆弱的。许多学者都注意到了这一点，最早的是Pierre Duhem，他的“稳定性原则”指出，当模型的输入假设大致成立时，模型应该能够得出大致相同的推断结果（Fletcher 2020）。

模型的波动性可能由多种效应引起，例如著名的蝴蝶效应（Schuster 1998）或天蛾效应（Winsberg 2018），分别指的是模型输出对边界或初始条件的敏感性（蝴蝶效应）或模型内部结构的模糊性（天蛾效应）。SA从业者也熟悉模型中参数误差的累积，这被称为不确定性级联（Christie等人2011），当模型规模扩大及其不确定输入参数的数量增加时就会发生这种情况。有时，模型制作者希望构建越来越精确的模型，这种愿望会加剧模型的脆弱性（Saltelli 2019）。当分析师试图在许多旨在复现统计或计量经济推断的分析研究中复制模型时，他们可能会发现模型的“分析灵活性”（Breznau等人2022），正如刚才所讨论的。一些作者指出，在政策研究中，模型不确定性可能会被人为压缩（Funtowicz和Ravetz 1990），以便得到一个可用（即不太不确定）的结果。Leamer建议使用全局SA仔细探索假设空间的邻域（Leamer 1985, 2010），这提醒我们，虽然模型是探索和发现的强大工具，但它们也极易受到不确定性处理不当的影响。特别是在利害关系重大且模型对重要决策至关重要的情况下，这种脆弱性可能会带来后果。当模型被用作为艰难决策找借口的替罪羊时，这一点尤为明显。科学社会学家Brian Wynne在谈到大型建模项目时指出：

无论是否有意以这种方式设计和使用，大型建模都可以被解释为一个政治符号，其核心意义在于剥夺人们参与政策制定和承担责任的能力（Wynne 1984, 311）。

Donella Meadows是七十年代增长极限研究领域建模研究的著名倡导者，她对用于支持政策决策的几个大型计算机模型的质量管理有独到见解（D. H. Meadows和Robinson 1985, XIV）：

多年来，该领域从业者提出的投诉和改进建议清单几乎没有变化，事实上几乎没有人遵循这些建议。据我所知，没有令人兴奋的新方法，没有更好的方法来匹配问题，没有更多的想象力来描绘社会，当然也没有更好的文档标准。因此，我们在这里引用的例子、文献参考和结论仍然是有代表性的。添加更多最新的例子既不会与书中的观点相矛盾，也不会改变任何观点。这些评论已有四十年的历史，但它们会定期重新出现（Padilla等人2018），并在危机时刻（如上述的COVID-19大流行期间）引起公众的关注。因此，将SA纳入学生和未来从业者的建模和计算机素养培训中是明智的。为了建立对SA的全面理解，应该鼓励学生面对SA结果中的矛盾和不确定性。这可以通过小组讨论、辩论和探索不同视角来实现。教师也应该意识到，并不是每个人都相信SA的具体优点，特别是因为它不是大学课程中的教学内容。尽管SA已经经历了三十年的深入研究（Tarantola等人2024），但其他方法可能对大多数人来说更为熟悉，例如半参数模型、鲁棒估计或推断方法。当一些模型选择培训时，可能会包含各种类型的信息标准，而不仅仅是SA。由于建模不是一门独立的学科，SA也不是，受过训练的统计学家可能会怀疑SA是否能比统计学提供更好的结果。SA从业者在向期刊提交作品时收到的评审中就有这种体验。缓解这些担忧的最佳方式是通过实际案例来展示，其中可以测试不同的策略。教师还可以展示SA与机器学习或运筹学等领域之间的合作如何使所有相关方受益。

3 敏感性分析的教学法

敏感性分析在风险评估和定量建模中占据了一个独特的地位。它不仅仅是建模的计算附加组件，而是一种结构化的探究，探讨不确定性如何通过假设和模型结构传播。教授SA不仅仅是传递算法，还需要帮助学习者从确定性推理转向结构化的不确定性探究。在本节中，我们将SA教学法置于成人学习和统计教育的既定理论框架内。将敏感性分析视为概念性变化。教授SA的一个核心挑战是，许多学习者——特别是工程师、经济学家和政策分析师——将模型视为确定性产物，将模型验证等同于校准或拟合优度。运筹学关注优化函数和约束的精确表示，然后进行优化。SA通过优先考虑探索而非优化来挑战这些框架，并通过使用基于方差的技术来突出不确定性，例如，通过将输出方差分解为输入及其交互作用的结构化贡献。从建构主义学习理论（von Glasersfeld 1989）的角度来看，我们可以认为学习者在接收新信息时会构建心理模型。当先前的心理模型与新证据冲突时，必须发生概念性变化。例如，SA学习者必须重新构建他们对敏感性的理解，从一次只考虑一个因素的推理转向识别交互效应和基于方差的归因。在这方面，带有反例的确定性启发式方法——例如那些一阶效应可以忽略而交互效应占主导地位的函数——可以作为认知冲突的触发器。通过引导性反思，学习者重新组织他们对模型结构的心理表征，内化影响本质上是多变量和分布依赖性的观念。

敏感性分析中的阈值概念。阈值概念框架（Meyer和Land 2005）为理解为什么SA难以掌握提供了有力的视角。阈值概念是变革性的、不可逆的、整合性的，并且往往令人困扰。一旦理解了这些概念，它们从根本上改变了人们对一个学科的认知。几个SA概念很可能具有阈值概念的特征：

- 数值实验作为实验设计，
- 方差作为信息而非噪声，
- 方差分析（ANOVA）分解作为影响的结构性表示，
- 一阶效应和总效应之间的区别，
- 交互作用的非加性，
- 截断中的有效维度与叠加感，
- 作为SA适用因素的建模选择。学习者可能难以解释基于方差的敏感性度量或与时刻无关的度量，这并不是因为计算复杂性，而是因为这些指标要求从概率角度重新概念化影响。跨越这些阈值后，从业者开始系统地探究假设，而不是启发式地调整参数。从教学法的角度来看，认识到阈值概念意味着教学应该让学习者接触可视化、模拟和解释性练习，以强化这些概念的掌握。体验式学习和基于模拟的教学。体验式学习循环（Kolb 2015）包括具体经验、反思性观察、抽象概念化和主动实验。将这些应用于SA课程，可以得出以下步骤：

1. 学习者首先运行随机模拟（具体经验）。
2. 他们检查输出变异性和初步的重要性度量（反思性观察）。
3. 介绍正式的ANOVA分解和指数定义（抽象概念化）。
4. 学习者修改模型结构（主动实验）。基于模拟的学习与现代统计教育研究相呼应，后者强调通过计算实验而不是单纯的符号操作来理解概念。对于SA来说，这意味着蒙特卡洛实验应该先于正式证明，使学习者能够通过散点图或其他图形表示来经验性地观察方差模式，然后再进行分析分解。成人学习和专业相关性。许多SA学习者可能是博士生、博士后或职业生涯中的专业人士。作为成年人，他们可能是问题中心的、自我导向的，并且受到问题与现实生活情境相关性的驱动。例如，在风险分析背景下，这表明SA教学应该从具体失败或由于不确定性处理不当而产生的争议开始。环境风险、金融建模或基础设施韧性的案例研究将抽象方法与实际的专业关切联系起来。参与者自己的模型可以作为学习的基础，利用先前的经验作为教学资源。认知框架：SA作为模型批评。除了程序性培训之外，SA教学法还应培养认知美德——透明度、鲁棒性和批判性探究。因此，教授SA和敏感性审计成为了一种批评模型：一种识别不确定性结构驱动因素的取向，包括那些与分析师的心态和兴趣相关的因素。这种框架将SA置于风险分析的更广泛的方法论讨论中，强调问责制和反思性，在政策相关的建模中尤为重要。整合这些理论视角可以产生几个设计原则，例如将SA学习视为概念性变化而不仅仅是技术获取；识别并明确处理阈值概念；围绕体验式模拟周期构建教学；并将教学基于真实的工业、管理、社会或政治问题。

4 SA课程的内容：应该教授什么

我提出了一种有组织的SA形式，我称之为“全局敏感性分析”，其中选择了一组替代假设，并确定了相应的推断区间。只有当假设的邻域足够广泛以具有可信性，且相应的推断区间足够狭窄以具有实用性时，结论才被认为是可靠的。

我们在表1中提供了三种可能的课程格式：短期、中期和长期，分别对应一个、两个和四个ETCS学分。在其他方法中，我们设想教授SA的新发展，例如基于最优运输的方法（Borgonovo等人2025），将SA与机器学习中使用的特征重要性研究相结合的方法（Antoniadis等人2021），或将局部和全局（glocal）方法联系起来（Borgonovo等人2016）。关键步骤的总结应包括表1中所有格式的培训元素。表1. 课程主题。主题

关键来源

格式

引言：不确定性和敏感性分析（UA和SA）

Saltelli等人（2008）

全部

SA的实验设计

Becker和Saltelli（2015）

全部

基于方差的方法I

Saltelli等人（2008）

全部

基于方差的方法II

Saltelli等人（2008）

中等难度

与矩无关的方法

Borgonovo（2007）

长篇内容

有效维度

Kucherenko等人（2011）；Owen（2013）

长篇内容

非独立输入

Kucherenko等人（2011）

长篇内容

元建模

Sudret（2008）

长篇内容

通过机器学习进行SA

Antoniadis等人（2021）

长篇内容

Shapley值

Owen（2014）

长篇内容

敏感性审计

Saltelli（2025）

全部

模型社会学

Morgan（2012）

长篇内容

SA入门

Kozlova（2025），Helton（1993）

全部

分析范围的定义。应向学生介绍相关文献，强调有效的SA必须从明确分析范围和背景开始。这一步骤确保了分析目的和感兴趣的结果能够被准确表述。研究的背景可能因目标不同而有所差异，包括：

- 优先级排序：专注于关键输入以进行更深入的探索，
- 模型简化：固定某些输入以减少模型规模，
- 识别关键输入区域：定位输入空间中的影响区域，
- 数据评估：检查可用数据的特征和局限性，
- 决策支持：系统行为探索。这些目标最终服务于两个互补的目的：模型开发和系统探索。前者有助于使模型更好地符合实际情况，而后者则揭示了模型对决策或支持的行动的影响。重要的是，必须明确界定特定的感兴趣输出，并将其与其他潜在模型输出区分开来。这一点在20世纪80年代就已经被最早的“模型专家”（D. Meadows等人，1982年）所强调。这意味着，如果模型用于新的目的，其敏感性需要重新评估（Edmonds等人，2019年），即单一的SA无法满足给定模型的所有需求。实际上，当模型应用于新的情境时，需要进行新的SA分析。反过来，新的SA分析可能会显示模型不足以回答提出的问题，从而需要开发修订后的模型版本，或者重新构建分析所针对的问题。不同的分析设置需要不同的考虑因素，学生应认识到每种方法的局限性和边界。例如，SA可以专门用于识别值得进一步收集数据的最重要因素，或者通过减少非关键因素来简化模型，或者识别对输出总方差有贡献的因素子集等。这种理解将帮助他们将具体的SA目标与适当的方法选择联系起来。

输入的识别及其分类。必须指导学生系统地识别和描述模型输入中的不确定性。一个关键的学习目标是鼓励他们采取全面而谨慎的方法：他们应该广泛收集相关不确定性来源，但在定义极端值和统计分布形状（如范围、相关性或概率密度函数）时需要谨慎判断。值得注意的是，虽然不确定性通常被低估，但在某些情况下，它可能被过度估计，例如在政策争议中，一方可能试图证明某种行动（如限制污染物暴露）产生的估计结果过于不确定，无法证明其成本的合理性（Saltelli等人，2013年；Michaels，2008年）。一个关键方面是触发器的使用——这些离散输入允许模型在运行时动态选择不同的公式、情景或政策；用上述的分岔路径花园的比喻来说，触发器可以用来决定在花园中选择哪一条路径：使用一种数据插补策略还是另一种，是否包含对照组，回归模型的形式，以及使用文献中报告的不同公式之一来计算蒸散量等（Puy, Sheikholeslami等人，2022年）。学生应准备好在参与式环境中使用模型。在这种情况下，建模活动应成为各方用来展示不同观点和信念影响的工具。通过研究现有案例（如Lane等人，2011年；Nabavi，2025年）可以促进这种学习。同时处理时间序列和空间地图作为输入（如气候预测、土地利用数据）和输出（如风险地图、影响预测）也是有益的。这包括理解时间和空间依赖性如何影响不确定性的传播。重要的是要强调统计独立输入（例如，相互不影响而变化的参数）和依赖输入（例如，相关的温度和湿度变量）之间的区别。强调这一区别有助于学生避免在SA中的方法错误，并确保结果的稳健解释。

选择要应用的方法。选择SA方法需要平衡几个方面。例如，分析师可能希望他们的敏感性测量具有高精度，但这通常需要大量的计算资源。因此，SA技术需要在单次模型运行的计算工作量和达到可靠结果所需的模型运行总数之间取得平衡（Iooss和Saltelli，2016年；Iooss和Lema?tre，2015年）。选择合适的SA方法也严重依赖于分析的具体目标。不同的方法更适合不同的情况。在选择方法时，可以考虑以下因素：

- 想要了解什么？例如，识别最重要的因素，或理解它们之间的相互作用，或识别那些最不重要的因素以简化模型或分析？
- 分析师有多少时间和计算资源可用？应该使用筛选方法还是更全面的定量方法（Campolongo等人，2011年）？
- 考虑到上述因素，有多少输入因素？筛选方法更适合处理大量因素。
- 是否可以预见到模型的某些特征，如输入和输出之间的线性或单调性？
- 样本是否已经准备好（数据驱动的分析），还是需要专门设计（设计驱动的分析）？
- 分析的接收者是谁？有些方法比其他方法更简单，可以用简单的英语解释。当分析的接收者本身没有接受过STEM（科学、技术、工程、数学）学科的培训时，这一点很重要。

（有关方法选择的指导，请参见图1和表2中的决策树。）

表2：该表概述了主要SA方法的关键特征，重点介绍了代表性方法。它不包括更专门的技术，如与矩无关的SA或变异图分析。

线性回归

秩回归

筛选

基于方差的

元建模

因素数量

100

100

100

25

50

计算成本

100/1000

100/1000

10k

50k

100/1000

处理非线性模型

否

是

是

是

是

处理因素间的相互作用

否

否

是

是

是

注意：表中呈现的值来源于成熟的实践经验。虽然元建模本身不是一种SA方法，但它是一种构建替代模型的强大工具。这些替代模型可以快速执行（通常在可忽略的时间内），即使对于涉及多达50个输入因素的问题也能实现高效的基于方差的SA分析。对于大约有100个输入因素的问题，建议先使用筛选方法作为初步步骤。这些方法可以识别并消除不重要的因素，从而缩小后续基于方差的SA分析的范围。蒙特卡洛输入因素样本可以同时支持：（i）线性和秩回归，以评估输入和输出之间的线性或单调关系；（ii）元建模，以构建用于更深入结构分析的替代模型。这种组合策略有助于初步理解模型行为，并为是否需要应用基于方差的更严格的定量敏感性测量提供决策依据。

图1：SA方法选择的决策图（来自de Rocquigny等人，2008年）。输入样本的生成。在这里，学生将学习到设计良好的样本的重要性以及分析的收敛性如何依赖于它。这里教授了随机、拉丁超立方和准随机抽样方案。输入样本必须能够全面调查输入空间。其大小应与可用的计算时间、模型特征和所需的敏感性估计精度水平保持一致。这里还提供了监控输出收敛性的工具。所有模拟的输入和输出（I/O样本）构成了SA的输入。应用选定的方法并获得敏感性测量结果。SA过程可能很复杂，应全面报告SA结果，以便最终用户了解所学到的内容和练习的局限性。重要的是，不仅要报告敏感性指数，还要可视化被识别为有影响的输入-输出关系。当一个输入的效果在输出空间中变化时，单一指数可能会产生误导。多维数据可视化技术（Kozlova等人，2024年；Piccolotto等人，2023年）或重新计算数据子集的指数（Borgonovo等人，2024年）可以揭示这些变化，并确保SA的建议与潜在模式保持一致。如上所述，分析的接收者是政策制定者、监管者、质量经理还是其他非专业利益相关者，这一点很重要。对于教师来说，这项任务可能特别具有挑战性，因为学生自己的技术培训可能导致他们只关注分析本身，而忽略了需要理解分析结果的人。上述一些要点可以总结在一个检查表中：

- 全局探索输入空间，而不仅仅是一次一个因素，
- 不仅抽样参数和边界条件，还要抽样结构、框架和问题定义，
- 为方法的选择提供理由——在给定背景下，“重要性”指的是什么？永远不要只运行模型一次。在模型构建阶段也使用蒙特卡洛驱动器来处理不确定性和SA（总是还有更多的错误需要发现），
- 不要按固定百分比改变每个不确定因素。这要么意味着所有因素的不确定性相同，这是罕见的，要么意味着分析师没有评估每个因素的合理不确定性范围，从而导致草率的SA分析，
- 无论选择哪种SA方法，结果都需要用简单的英语解释，
- 使用多维数据渲染来可视化最关键的效果，以展示相互作用的形状。

敏感性分析资源和工具的总结。如今有许多软件工具和学习资源可以帮助应用不同的语言中的各种SA方法。表3提供了这些资源的选集，包括它们的学术参考文献、在线存储库和开源库。它们按功能和可访问性进行了分类。

表3：敏感性分析的软件工具。**类别**
**资源/工具**
**关键特性**
**访问/URL**
**理想用户/应用**

**通用资源**
**R手册**
**SA原则和方法的基础资源**
Da Veiga等人（2021年）
**寻求基础知识的研究人员**

**Samo会议材料**
**高级讨论、出版物和方法**
**Samo网站**
**SA领域的研究人员和教育工作者**

**欧盟委员会（JRC）**
**框架、SimLab软件和全球SA工具**
**JRC网站**
**欧盟委员会工具的实践者**

**Réseau Mexico**
**用于协作SA的资源和MTK（墨西哥工具包）**
**使用MTK的协作SA项目**

**SA软件工具**
**SimLab**
**全球SA的免费在线工具**
**教育用途和SA项目**

**OpenTURNS**
**用于不确定性量化的C++/Python库**
**统计建模和风险评估**

**UQLab**
**基于MATLAB和Python的框架，附带详细文档**
**MATLAB和Python研究人员及教育工作者**

**Python库**
**SALib**
**用于SA方法的Python库（如Sobol'、FAST和PAWN）**
**Python程序员和教育工作者**

**R包**
**sensitivity**
**用于基于方差的SA方法的包**
**R语言的学生和专业人士**

**sensobol**
**用于R语言的基于方差的敏感性指数工具**
**专注于基于方差SA的研究人员**

**MTK（墨西哥工具包）**
**用于执行SA方法的流程导向工具包**
**协作R项目**

**专用工具**
**GEM-SA**
**基于高斯过程的SA，适用于复杂模型**
**高级SA应用**

**MUCM项目**
**SA和不确定性分析的教育材料**
**教育工作者和研究人员**

**电子表格工具**
**SA Excel插件**
**用于基于样本的SA的免费Excel插件**
**初学者使用的Excel插件**

这些工具提供了针对不同复杂度和用户技能水平的多种功能，从基础选项（如用于基本SA的Excel插件）到高级库（如OpenTURNS和GEM-SA，用于更复杂的模型评估）。图1是一个简化的示意图，用于帮助决定使用哪种方法。从全局SA到量化社会学，都需要纳入一个关键的社会学视角：任何定量分析都涉及技术质量和规范维度。后者要求意识到模型可能会无意中忽略利益相关者的观点或对问题的看法（Jasanoff 2003）。社会学家和历史学家深知数字依赖于产生它们的历史、社会和政治背景（Porter 1995；Desrosières和Desrosières 2011；Hacking 1990），不同学科（如物理或经济学）的数字遵循不同的规律并面临不同的挑战（Mennicken和Espeland 2019）。当模型的输出可能引发政策分歧时，SA可以扩展到更广泛的不确定性范围。这就是敏感性审计的领域（Saltelli等人2013），它通过质疑模型开发者和问题所有者的目标、目的和偏见来扩展模型质量分析。

敏感性审计关注的问题比传统分析方法更为广泛（参见Edward Quade的“分析和建模的陷阱”；Quade 1980）。它与Funtowicz和Ravetz（1990）提出的定量信息质量标准有类似之处。该缩写代表数字（number）、单位（units）、范围（spread）、评估（assessment）和来源（pedigree），其中范围可以是不确定性界限，评估指的是研究的质量，来源指的是执行研究的团队的质量。这些属性旨在反映一个扩展的同行社区的工作成果（van der Sluijs等人2005）。根据欧盟的影响评估指南（Commission 2023, 563），敏感性审计“更广泛地考虑了所有类型的不确定性，包括模型中嵌入的结构假设和问题框架中的主观决策”。当量化结果用于可能引发政策分歧的情境时，SA可以扩展到更广泛的不确定性范围。

这些工具提供了多种功能，适用于不同复杂度和用户技能水平的需求，从基础的Excel插件到用于更复杂模型评估的高级库（如OpenTURNS和GEM-SA）。图1是一个简化的示意图，有助于选择合适的方法。敏感性审计还涵盖了规范性和政策问题，当量化结果用于政策决策时，需要使用七点检查清单：
1. 检查数学建模的修辞使用；
2. 采取“假设搜寻”的态度；
3. 在数据生成过程中识别问题；
4. 在问题定义之前发现敏感假设；
5. 追求透明度；
6. 关注模型回答的关键问题，全面探索所有假设；
7. 在SAPEA（欧洲科学院的政策建议）指南中也有描述（SAPEA 2019, 88–89）。敏感性审计的应用示例包括Lo Piano和Robinson（2019）、Sheikholeslami等人（2022）、Lo Piano等人（2024）和Lo Piano和Saltelli（2025）的研究。GitHub仓库中提供了模型示例，这些模型可以验证假设、阐明与其他模型的差异，并用于敏感性分析，以探索“如果……会怎样”的问题，从而揭示系统中最需要进一步研究的方面以及最需要更多实证数据的领域。

GitHub仓库（https://github.com/Sensitivity-Analysis-for-Model-Output/HowToTeachSensitivityAnalysis）提供了一组代表性的测试案例，这些案例有助于将概念付诸实践。表4总结了测试案例及其选择理由。

**测试案例示例**：
- **概率天气预报**（Kerin和Engler 2020，Palmer 2019）：演示了气象初始条件的扰动如何通过模型传播并影响预报可靠性，通过Sobol'敏感性指数量化。
- **投资盈利能力**（Kozlova等人2024）：展示了需要全局SA的普遍交互效应。
- **碳足迹**（Kozlova等人2024）：展示了某个因素如何根据另一个因素改变影响方向。
- **钢结构可靠性**（Ahola等人2024）：强调了可视化在支持SA中的重要性。
- **投资组合建模**（Saltelli等人2004）：展示了全局SA在金融领域的应用。
- **感染动态**（Puy、Beneventano等人2022）：展示了感染动态方程复杂性增加导致问题复杂性和有效维度增加的情况。

教师需要选择评估策略来评估学生对SA的理解和进展，例如基于项目的作业、小组展示和互动讨论。这些评估应同时关注SA的理论概念和实际应用，并根据所学内容动态调整课程内容。

**学习成果**：
- **短期课程版本**：1个ETCS学分。完成短期课程后，学生将能够：
1. 理解关键概念：区分不确定性分析和SA，认识到它们在建模和决策过程中的不同目的和应用。
2. 设计数值实验：理解仔细的实验设计对于系统探索多维因素空间和进行有效数值SA实验的重要性。
3. 选择最佳实践：根据不同问题场景选择合适的基于方差的SA方法。
4. 认识方法局限性：理解局部SA技术的局限性以及使用全局方法捕捉更广泛模型行为的重要性。
5. 定义输入因素的重要性：在SA背景下明确定义输入因素的“重要性”以获得有意义的结果。
6. 探索测试案例：通过多种测试案例获得应用SA的灵感。
7. 利用软件工具：掌握用于进行SA的各种编程语言中的软件。
8. 掌握蒙特卡洛方法：内化在蒙特卡洛框架内开发和改进模型的概念。
9. 提高分析的稳健性：认识到SA在提高分析稳健性方面的价值，包括对建模过程本身进行建模和进行敏感性审计的潜力。

**中长期课程版本**：
- 中期课程包含两个ETCS学分，教师可以根据自己的目标和兴趣调整课程内容。
- 长期课程包含四个ETCS学分，除了短期课程的目标外，学生还将：
1. 扩展方法知识：学习使用更广泛的SA技术，包括与参数空间无关的方法、从简化参数空间抽样的策略以及处理非独立变量的方法。
2. 提高编码能力：直接用一种或多种编程语言编码SA方法，增强计算技能和算法实现的理解。
3. 拓展学科应用：接触来自不同学科的广泛测试案例，了解SA在不同领域和问题情境中的多功能性。
4. 深化分析能力：培养批判性分析和解释SA结果的能力，并有效地向具有不同技术水平的利益相关者传达这些发现。

**结论**：
教授SA对科学界、教育以及量化和建模领域具有广泛的影响。作者多次遇到需要诚实SA的量化案例。模型的认知权威性源于其数学和计算基础，但往往难以受到合理批评（Saltelli等人2025）。正如第2节所强调的，许多方法可以有效应对这些挑战。然而，作者认为SA以其“令人不安的坦率”提供了一个独特的解释框架——将构成模型的代码转化为清晰、可解释语言的关键。确定模型或模型集的相关性通常需要调查工作（Wynne 1984）。当模型开发者主动进行敏感性分析时，这种工作变得具有预见性，促进了可辩护和透明的实践。SA为分析模型的内部动态提供了“额外工具”，从而洞察它所代表的现实世界系统（Morgan 2012）。因此，作者建议将全局SA整合到模型构建过程中，而不仅仅是作为事后附加步骤。这一建议适用于所有模型开发者，包括使用类似方法（如多宇宙分析或扰动物理集合）的人，他们可以从SA的进步中受益。尽管SA在科学建模中至关重要，但大多数高等教育课程中缺乏它，这需要关注。解决这一差距需要为教育工作者提供适当的工具和教学材料，以及有效的策略来组织这些资源，以促进学生的学习。这样的努力有助于弥合理论模型开发与实际验证之间的差距，最终使未来的研究人员能够设计出在数学上严谨且在社会和科学上负责任的模型。

热点排行