新型单位-Lindley混合效应模型在电力可及性数据分析中的应用与模拟研究

《Environmetrics》:A New Unit-Lindley Mixed-Effects Model With an Application to Electricity Access Data

【字体: 时间:2026年02月03日 来源:Environmetrics 1.7

编辑推荐:

  本文综述了针对单位区间内相关响应变量分析的新型单位-Lindley混合效应模型(NULMM)。该模型基于广义线性混合模型(GLMM)框架构建,采用自适应高斯-埃尔米特求积(AGHQ)法进行参数估计,解决了传统β混合模型和单位-Lindley(UL)混合模型无法处理边界值为1的数据局限。通过蒙特卡洛模拟验证,模型在偏差和均方误差(MSE)指标上表现优异,并成功应用于南亚国家农村电力可及性影响因素分析,发现时间、对数GDP与通电率呈正相关,而农村人口规模影响不显著。研究为比例型边界数据建模提供了更灵活的统计工具。

  
引言
近年来,单位区间有界数据的建模研究备受关注。自Ferrari和Cribari-Neto(2004)提出β回归模型以来,陆续涌现出单位Birnbaum-Saunders分布、双参数单位高斯分布等多种替代模型。其中单位-Lindley(UL)分布和新单位-Lindley(NUL)分布因其对单位区间数据的良好拟合性能而受到重视,但这些模型仅适用于独立响应变量分析。针对实际研究中常见的相关性和有界性并存的数据特征,需开发能够分析单位区间有界且相关响应变量的混合效应模型。
新单位-Lindley分布理论框架
研究采用Mazucheli等人(2020)提出的NUL分布,其密度函数支持区间[0,1],特别适用于包含边界值1的响应变量建模。该分布具有指数族属性、单峰性和闭式矩表达式等特性,便于引入回归结构。通过重参数化将均值μ作为核心参数,并利用包含Lambert W函数的分位数函数生成随机变量。图2展示了不同参数下重参数化NUL分布的概率密度函数形态,直观呈现其灵活性。
混合效应模型构建与参数估计
NUL混合效应模型(NULMM)将响应变量与线性预测变量通过logit连接函数关联,同时引入服从多元正态分布的随机效应项捕捉个体间变异。参数估计采用拉普拉斯近似和AGHQ法,其中拉普拉斯近似因泰勒展开阶数限制存在估计偏差,而AGHQ(5点/11点求积)能无偏还原所有参数。模拟研究表明,在样本量n=10-300、测量次数m=10-20的不同场景下,AGHQ法对固定效应和随机效应方差均具有更优的偏差控制能力(见表2-9)。
南亚农村电力可及性实证分析
应用NULMM分析南亚国家2009-2023年农村通电率数据,发现时间(β=0.258, p<0.001)和对数GDP(β=1.554, p<0.001)显著正向影响通电率,而农村人口规模系数为负但不显著(β=-0.037, p=0.493)。收入水平分析显示,中高收入国家较低收入国家具有显著更高的通电率(β=2.145, p<0.05)。模型比较中,NULMM的AIC(-452.99)和BIC(-452.44)均优于β混合模型和UL混合模型,证实其对该类数据的适用性。
随机斜率模型拓展分析
进一步构建包含时间、农村人口对数随机斜率的模型(公式13),结果显示随机截距标准差为1.478,时间斜率标准差为0.296。随机效应相关性分析发现截距与时间呈强负相关(r=-0.887),与农村人口对数相关性较弱(r=0.085)。该模型有效捕捉了不同国家通电率随时间变化的异质性轨迹。
讨论与展望
本研究提出的NULMM解决了传统模型对边界值处理的局限性,为比例型纵向数据提供新分析方法。未来研究方向包括:拓展模型至同时处理0/1边界值的情况;优化方差成分估计方法;开发基于广义估计方程(GEE)的群体平均效应模型。这些拓展将进一步提升模型在公共卫生、经济学等领域的应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号