广义加性模型与神经网络在应用中的比较：一项系统评价

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Expert Systems with Applications》：Comparison of generalised additive models and neural networks in applications: A systematic review

【字体：大中小】 时间：2026年01月04日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　本文通过系统综述分析143篇论文中的430个数据集，比较广义加性模型（GAMs）与神经网络（NNs）的预测性能。研究发现两者在常用指标（RMSE、R2、AUC）上无显著优劣，但NNs在大数据及多预测变量场景中表现更优，而GAMs在数据量小且注重可解释性时更具竞争力。文献中存在数据特征和NN复杂度报告不完整的问题，建议未来研究加强透明度。

　　
本研究针对广义加性模型（GAMs）与神经网络在预测建模中的实际表现展开系统性综述，通过分析143篇文献中包含的430个真实数据集的对比实验结果，揭示了两种模型在不同场景下的适用性差异。研究采用PRISMA框架规范流程，发现当前文献存在模型复杂度描述模糊、数据特征披露不全等关键局限性。

在模型特性对比方面，GAMs通过显式定义的加性结构保留了较高的可解释性，其优势在数据量较小（通常低于5000样本）或特征维度较低（少于20个预测变量）的场景中更为显著。此类条件下，GAMs与神经网络在RMSE、R2和AUC等核心指标上的差异往往不超过5%。研究特别指出，当数据集存在稀疏特征分布或时间序列依赖性时，GAMs的平滑拟合机制能更有效捕捉潜在结构。

神经网络表现优势主要体现在数据规模较大（样本量超过10万）或特征维度较高（超过50个预测变量）的复杂场景中。这种性能提升主要源于神经网络对非线性关系的自动建模能力，以及通过隐藏层参数调整实现的高维特征交互。值得注意的是，研究团队通过分析发现，当神经网络隐藏层神经元数量超过数据集特征数的3倍时，模型泛化能力反而会出现显著下降。

模型选择策略的时效性特征值得关注。2015年前的研究中，神经网络在多数基准测试中表现更优（平均优势约2.3%），但这一差距在2018年后逐渐缩小。这种变化趋势与深度学习架构的演进密切相关——现代神经网络在处理中等规模数据集（5000-50,000样本）时，开始显现出比传统GAMs更灵活的拟合能力。不过研究同时发现，超过60%的对比实验未明确披露神经网络的具体超参数设置，这可能导致部分性能差异的归因存在偏差。

在领域应用差异方面，医疗诊断领域（含时间序列数据）中GAMs的优越性较为明显，其平均AUC值比神经网络高1.2%-1.8%。这可能与生物医学数据中存在较多可解释的线性或准线性关系有关。而金融风控领域（如信用评分、欺诈检测）则更倾向使用神经网络，其优势主要体现在处理高维异构数据（如多模态金融数据）时，平均F1分数提升约3.5%。值得注意的是，农业气象预测这类需要长期时间序列分析的场景，GAMs的渐进式建模特性反而展现出更稳定的性能。

研究还发现模型性能与数据更新频率存在间接关联。在金融高频交易数据中，神经网络表现出更好的实时适应能力（平均RMSE周波动率降低18%），而医疗长期随访数据中，GAMs的稳定性更优（年度性能漂移控制在3%以内）。这种差异源于神经网络参数更新的动态特性，与GAMs的固定平滑参数形成对比。

在方法学改进方面，研究团队提出"三维度评估框架"：数据规模（样本量）、特征复杂度（特征数量及交互层次）、任务类型（分类/回归/时序）。通过构建混合效应模型，证实任务类型对模型性能的影响权重最高（β=0.67, p<0.01），其次是数据规模（β=0.42）和特征复杂度（β=0.31）。这解释了为何在特征维度较低的任务中，GAMs往往能保持竞争力。

研究特别强调模型透明度的量化评估，发现高可解释性需求场景（如FDA药物审批）中，采用GAMs的论文平均披露模型决策路径的完整度（82%）显著高于神经网络的（37%）。在需要解释归因的场景（如金融信贷评估），GAMs的系数解释性评分（平均4.2/5）是神经网络的2.3倍。

在实践指导层面，研究提出"双轨选择策略"：对于数据规模大、特征维度高且解释性需求不强的场景（如用户行为预测），推荐采用深度神经网络并配合SHAP等后处理解释工具；而在医疗诊断、政策评估等需要过程解释的领域，GAMs仍是更优选择。研究同时建议建立"模型复杂度-数据规模"匹配矩阵，帮助决策者根据具体业务参数选择合适模型。

值得关注的是，研究发现了模型性能与领域研究活跃度的非线性关系。在计算机视觉等神经网络主导领域，模型迭代速度远超统计方法，但在传统统计强项的领域（如社会科学调查），GAMs的创新应用反而更频繁。这种差异可能源于不同领域对模型可解释性的需求强度不同，以及数据获取成本对算法选择的制约。

研究最后揭示了当前方法学的主要局限：约45%的对比实验未报告完整特征分布信息，67%的神经网络模型未披露优化过程中的过拟合防控措施。建议未来研究采用"模型卡片"标准化披露框架，强制要求报告数据分布的基尼系数、特征相关性矩阵、模型收敛稳定性等关键指标。

该系统性综述为模型选择提供了新的决策依据，特别在中小型数据集和强解释性需求场景中，GAMs展现出持续的生命力。研究同时建议建立跨学科的方法论协作平台，促进统计建模与深度学习的深度融合，特别是在可解释强化学习、因果推断结合神经网络等新兴交叉领域。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号