编辑推荐:
本文通过机器学习方法,利用布基纳法索的农业调查面板数据,探究了多种生态农业(agroecology)实践对农户粮食安全的预测价值。研究发现,综合多种生态农业实践(如作物与牲畜物种多样化)能有效预测粮食安全状况,机器学习模型的预测准确度可达72%。文章提出,该方法(无需依赖耗时的饮食多样性调查数据)有助于构建低成本、高效率的粮食安全动态监测与预警系统,为决策者和援助机构提供及时、关键的干预依据。
研究背景与意义
全球范围内,粮食不安全问题影响着大量人口,其中低收入国家,尤其是撒哈拉以南非洲地区,情况尤为严峻。2023年,该地区中度或重度粮食不安全的发生率高达63.3%,是全球平均水平(28.9%)的两倍多。为应对此危机,决策者、资助方和非政府组织迫切需要精简有效的指标,以便更精准地定位脆弱家庭并指导政策与援助。然而,现有的粮食安全监测工具往往只关注问题的孤立维度,且部分方法较为静态。本研究旨在填补这些空白,通过聚焦一个综合性的粮食安全指标,并运用机器学习技术,探索生态农业实践与粮食安全改善之间的关联,识别对粮食安全结果具有预测相关性的关键变量。
研究方法
本研究以布基纳法索为案例区域,运用机器学习方法分析了一项为期7个月(2020年6月至12月)的永久农业调查(PAS)面板数据,该数据覆盖了5308个农场。研究的核心是构建一个综合粮食安全指标,该指标整合了三个维度的信息:食物消费评分(FCS)、生计应对策略(LCS)和家庭食品支出份额(FES),遵循世界粮食计划署(WFP)的粮食安全指标统一报告方法(CARI)。该指标最终将家庭分为四类:粮食安全、粮食安全有限、中度粮食不安全和严重粮食不安全。
研究采用了五种分类算法进行训练和预测:自适应提升(AdaBoost)、极限梯度提升(XGBoost)、线性支持向量机(SVM_L)、径向基支持向量机(SVM_R)和多层感知器(MLP)。数据被分为训练集(70%)、验证集(15%)和测试集(15%)。为了专注于农业生产活动本身的预测能力,并避免循环论证,建模时特意排除了对预测能力影响最大的食物消费评分(FCS),仅保留食品支出份额(FES)和生计应对策略(LCS)作为综合指标的组成部分。
研究结果
- 1.
模型性能表现
所有训练模型在测试数据上均表现出良好的预测能力。总体准确率从多层感知器(MLP)模型的64%到集成模型(如XGBoost)的72%不等。其中,XGBoost模型在召回率(72%)和F1分数(约60%)方面表现最佳,被认为是未来自动化应用的优选模型。模型的收敛时间普遍较短(小于1分钟),但支持向量机(SVM)模型的训练时间较长,约为30分钟。
- 2.
生态农业实践与粮食安全的关联
研究首先根据生态农业实践的强度将农场分为八个亚组。卡方检验揭示了生态农业实践强度与粮食安全状况之间存在统计学上的显著关联(p值=0.000)。结果显示,实行高度多样化生态农业(包含超过8种作物、4种以上牲畜及至少20棵树)的农场,其粮食不安全率仅为6.6%。相比之下,不进行牲畜和树木整合的非多样化可持续农场的粮食不安全率为17%,不进行牲畜和树木整合的非多样化常规农场的粮食不安全率为15%。而整合了牲畜和多样化作物的常规农场,粮食不安全率也较低(10%)。
具体到单个实践,拥有至少4种动物物种的农场,其粮食不安全率(10%)远低于没有动物的农场(25%)。在作物多样化方面,种植至少5种不同作物的农场粮食不安全率为10%,而不进行作物多样化的农场则高达34%。
- 3.
关键的预测变量
机器学习模型识别出对预测粮食安全状态最重要的变量。其中,与生态农业实践相关的关键变量包括:牲畜的总数和类型、使用本地种子、轮作实践、间苗实践、条播、地块数量、农林牧物种丰富度以及生产多样化。此外,一些社会经济变量也被确定为重要预测因子,例如用于购买投入品的资金量和来源、自产农产品的消费比例、农产品价值、食物支出占总收入的比例,以及在财务不稳定时期出售某些动产等生存策略。
部分依赖图(PDP)进一步揭示了这些变量与粮食安全概率之间的边际效应。例如,随着物种丰富度从0增加到4,家庭属于粮食安全等级的概率从0.32逐渐增加到0.35,表明更高的农业产品多样化与粮食安全水平提高正相关。同样,整合牲畜养殖(特别是能出售价值高达300,000西非法郎的牲畜)可使家庭粮食安全概率提高3%。非农工作通过多样化家庭收入来源,也增加了粮食安全的概率。然而,单独使用有机肥对提高粮食安全概率的边际效应有限,可能需要与其他实践结合才能发挥显著作用。
在人口统计学变量中,户主(女性)的年龄对粮食安全有负向影响,而家庭规模超过8人后,粮食不安全风险会增加2%。用于购买农业投入的资金在达到一定阈值(约700,000西非法郎)前,对粮食安全有积极影响,但超过该阈值后,若缺乏信贷支持,则可能影响家庭储蓄。
讨论与政策启示
本研究提出了一种在不依赖食物消费评分(FCS)的情况下,探索生态农业实践对粮食安全预测作用的方法。这对于在预算有限、希望缩短农业调查问卷长度的背景下,为决策者提供优先干预领域的指引具有重要意义。模型的性能(最高72%的准确率)表明,即使缺乏部分核心饮食数据,仅依靠易于收集的农业活动变量,也能对综合粮食安全状况进行有意义的预测。
研究结果证实,总体而言,实行生态农业的农场受粮食不安全影响的程度低于实行常规农业的农场。生态农业强化,即多种生态农业实践(如作物与牲畜物种多样化)的结合,被证明是预测粮食安全的重要指标。这支持了通过培训和激励农民综合采用多种生态农业实践来改善粮食安全的政策路径。
尽管研究主要关注生态农业实践,但一些非生态农业变量,如产品销售收入、家庭成员数量、购买投入品的资金量及来源、获得推广服务的机会以及收入来源的数量等,也被确定为重要的预测因子。这反映了家庭经济能力、制度与金融可及性以及收入多样化策略在塑造生产决策和增强粮食安全韧性方面的关键作用。
研究构建的八个农场亚组为设计和优先实施有针对性的政策提供了实用框架。例如,对于作物、林木和牲畜整合度均低的农场群体,政策可以激励其采用农林业、作物多样化和改善牲畜整合,以加强生态功能。
局限性与未来方向
本研究的局限之一在于模型仅使用同一数据集中的保留样本进行验证,未进行时间或地理上的外部验证。未来应用于其他地理背景时,需确保收集到可比变量或合适的替代指标。其次,研究承认了数据中类别不平衡的存在,但未在模型训练中应用如SMOTE等数据重采样技术,而是优先报告了稳健的类别特异性性能指标。未来的研究可以探索整合重采样或加权策略以改进模型在失衡类别上的表现。最后,需要明确的是,本研究并未确立生态农业实践与家庭粮食安全结果之间的直接因果关系。分析显示的是变量间显著的关联性,而非因果效应。未来的研究需要采用实验或准实验设计来严格评估生态农业集约化对家庭粮食安全的因果影响。
结论
本文通过描述性分析和预测性分析两种互补的方法,探讨了生态农业在提升粮食安全中的作用。结果表明,基于易于量化的家庭农业变量,机器学习模型能够以可接受的准确度预测综合粮食安全状态。生态农业实践,尤其是作物与牲畜的多样化整合,与粮食安全状况的改善显著相关。
这些发现具有多重意义:首先,为低收入国家的农业调查和粮食安全监测系统利用易收集的农业数据进行评估提供了潜力;其次,为推广生态农业集约化作为改善家庭粮食安全的路径提供了证据支持;最后,通过展示基于机器学习预测的可行性,为将预测分析整合到粮食安全评估和早期预警系统中开辟了新途径。未来的研究可以探索利用市场价格数据、遥感衍生指标等开源数据源,以构建更及时、成本效益更高的预测模型。