用于估计总体分布函数的高效估计器类:在辐射和财务会计数据中的应用
《Journal of Radiation Research and Applied Sciences》:Efficient class of estimators for estimation of population distribution function: Application on radiation and financial accounting data
【字体:
大
中
小
】
时间:2026年05月02日
来源:Journal of Radiation Research and Applied Sciences 2.5
编辑推荐:
Diaa S. Metwally | Zahrah Fayez Althobaiti | Iman Babiker | Khadiga Wadi Nahar Tajer | Mona Elmahi | Bent Elmina Haroun Ali
沙特阿拉伯利雅得伊玛目穆罕默
Diaa S. Metwally | Zahrah Fayez Althobaiti | Iman Babiker | Khadiga Wadi Nahar Tajer | Mona Elmahi | Bent Elmina Haroun Ali
沙特阿拉伯利雅得伊玛目穆罕默德·本·沙特伊斯兰大学(IMSIU)科学研究系,邮编11432
**摘要**
当总体特征发生变化或出现偏态时,传统估计量的效率通常会降低。为克服这一缺陷,本文提出了一类有效的估计量,用于简单随机抽样中估计总体分布函数。该类估计量结合了熟悉的辅助参数和函数变换,以提高在不同总体结构下的准确性和灵活性。本文推导出了偏差和均方误差(MSE)的理论表达式,并明确了这些估计量优于现有传统估计量的条件。这类估计量的通用形式包含了许多著名的估计量作为特例,表明其灵活性和更广泛的应用性。实证研究使用了五个真实数据集和一项模拟研究,涉及辐射科学和财务会计数据。这些应用展示了所提出方法在环境和金融领域中的实际重要性,因为在这些领域中,准确的分布估计对于风险评估和决策制定至关重要。比较结果表明,这类估计量在各种总体情况下始终能够实现更低的MSE和更高的相对效率。总体而言,所提出的通用类估计量为提高总体分布函数的估计提供了强大而多样的模型,由于其理论基础扎实和实证优势,它对调查抽样和应用统计研究具有很高的价值。
**1. 引言**
调查抽样和统计推断中的一个关键问题是总体分布函数的估计。总体分布函数提供了关于研究变量的所有必要概率数据,从而可以计算出分位数、百分位数、概率和风险度量等关键指标。与参数的点估计(如均值或总量)相比,分布函数的估计能提供更详细的总体结构信息。在那些分布特性(如偏度、尾部行为和变异性)对解释和决策至关重要的情况下,分布函数的估计尤为重要。
在大多数现实世界场景中,尤其是环境研究、辐射监测、财务会计和经济分析中,所关注的总体可能具有高度变异性和非正态性。例如,由于极端的环境或职业因素,辐射暴露水平往往呈现偏态分布且具有厚尾特性。同样,财务会计数据(如公司收入或利润、资产价值)通常是异构的,并包含异常值。在这种情况下,仅使用中心趋势度量可能导致不完整的结论或错误结论。因此,为了风险评估、监管规划、政策制定和财务决策,需要准确估计总体分布函数。在简单随机无放回抽样(SRSWOR)中,经验分布函数被广泛用作总体分布函数的无偏估计量。这种估计量是非参数的,与其他估计量相比简单,但当存在未使用的关于研究变量的辅助信息时,其效率并不一定高。长期以来,人们已经知道辅助信息在提高估计量准确性方面非常有用(Alshahrani & Elkalzah, 2025)。许多研究人员通过结合不同形式的辅助信息提出了更好的总体参数估计量,包括比率型估计量、指数型估计量、回归型估计量以及结合多种估计策略的通用类估计量。这些方法通常利用已知的总体均值、方差、变异系数、峰度或辅助变量的相关系数等量。其思想是,当研究变量与具有已知总体特征的辅助变量相关时,可以显著提高估计效率。近年来,利用辅助信息估计有限总体分布受到了广泛关注(Alshahrani & Elkalzah, 2025)。有研究通过使用辅助变量改进了总体分布函数估计量,并将辐射数据应用于实际场景,发现特别是在使用偏态环境数据时,该方法能够显著降低均方误差(MSE)(Ahmad et al., 2024a)。还有研究提出了在简单随机抽样下利用双重辅助信息的更好估计量,该方法在多个辅助变量的情况下显著提高了效率(Hussain et al., 2020)。另有研究将双重辅助信息和非响应纳入扩展分布函数的分布问题处理中(Ahmad et al., 2022)。
**2. 方法论**
本文提出的估计量类结合了熟悉的辅助参数和函数变换,旨在提高效率。通过引入适当的常数和参数,该类估计量可以生成多种特例估计量。这种泛化不仅整合了现有的各种估计量,还为在不同总体条件下优化效率提供了可能性。本文详细探讨了该类估计量的理论特性,并阐明了其优于传统估计量的条件,为实际应用提供了明确指导。效率的提升以相对效率百分比的形式进行评估,突显了辅助信息带来的收益。
**3. 实证验证**
为了证明所提出方法的有效性和合理性,本文使用了两个真实数据集:辐射暴露数据和财务会计数据。这些数据集涵盖了具有变异性和非标准分布的不同应用领域。辐射数据展示了在环境和人类健康研究中适当分布估计的重要性,因为了解暴露概率和极端值至关重要。相比之下,财务会计数据表明了分布分析在管理决策中的作用,特别是在衡量风险、不平等和绩效差异方面。基于这些数据集,本文比较了所提出估计量与传统估计量的均方误差和相对效率。实证结果表明,无论总体配置如何,通用类估计量始终能实现更低的MSE和更高的效率。该类的灵活性使其能够适应研究变量与辅助变量之间不同的相关结构,从而增强了其实际应用价值。
**4. 研究贡献**
本研究有三个主要贡献:
1. 通过提出一个开放且灵活的估计量类别,扩展了现有的分布函数估计知识体系。
2. 通过研究偏差和MSE分析提供了严格的理论依据,明确了高效条件。
3. 通过实际数据验证了该方法在环境和金融领域的相关性,证明了其在非理论环境中的适用性。
**5. 结论**
本文提出的估计量类为简单随机无放回抽样下的总体分布函数估计提供了一种通用且高效的解决方案。该类估计量以创新的方式开发,整合了已知辅助参数和函数变换,旨在提高效率。通过引入合适的常数和参数,该类可以生成多种特例估计量。这种泛化不仅汇集了现有的各种估计量,还为在不同总体条件下优化效率提供了可能性。本文详细探讨了该类估计量的理论特性,并为实际应用提供了指导。此外,实证验证也证明了该方法的有效性。因此,所提出的方法具有高效率,并且相关性强,从而消除了传统比率或回归估计器通常遇到的敏感性问题。此外,所提出的方法还扩展了分布函数估计的理论知识,得出了偏差和均方误差(MSE)的一阶近似表达式。过去的大部分研究主要基于对总体均值或总量的点估计;然而,当前的研究将效率改进策略扩展到了总体分布函数。分布函数的估计应该被视为对统计学的更有信息量和更广泛的贡献,因为它反映了总体的所有概率行为。该研究不仅报告了实证上的改进,还进行了分析比较,证明了在特定参数设置下所提出的估计器具有理论上的优越性。这有两个好处:增强了理论的严谨性,并提高了实践的透明度,使研究人员能够知道何时以及为什么应该使用所提出的估计器。另一个创新点是该方法对不同实际应用的灵活性。该估计器不限于特定的数据结构或领域,而是适用于具有偏度、重尾或较大变异性的异质总体。这一点在辐射暴露研究和财务会计分析等应用领域尤为明显,因为这些领域中的分布不规则性很常见。所提出的方法可以使用实际数据集进行实证验证,这也增加了其实际相关性。所提出的方法在操作上也具有灵活性,因为可以在估计器的结构中选择最优参数。这种优化使得在定义的类别中实现最小的平方误差,从而比大多数固定形式的估计器更高效。与传统方法相比,这是一个明显的优势,因为传统方法很少有可以在定义后更改的组成部分。在方法论方面,这项贡献也是新颖的。该研究有助于弥合辅助信息估计的理论发展与实际分布分析之间的差距。它促进了从单一估计器开发向可以适应特定抽样情况的设计类估计器的转变。所有这些特点使所提出的类别在现有估计器中脱颖而出,并显著改进了当前的调查抽样和分布函数估计状态。
本文的其余部分结构如下:第2节介绍了抽样框架,包括符号和符号说明。第3节回顾了采用的总体分布函数估计器。第4节介绍了所提出的广义类别,并推导了该类别的理论属性。第5节详细给出了基于实际数据集的数值研究。第6节使用辐射数据和财务会计数据比较了效率及其实际应用。第7节总结了关键发现并提出了未来研究的建议。第8节给出了所提出的估计器类别的未来发展方向。最后,在第9节中,我们提出了一些所提出的估计器的局限性。
2. 方法论
考虑一个由N个独立且可识别的单元组成的有限总体Σ = (Σ1, Σ2, …, ΣN)。使用简单随机抽样不放回(SRSWOR)方法选取了一个样本。指示函数分别用I(Yi≤Y)和I(Xi≤X)表示研究和辅助信息。进一步地,Fy=∑i=1N I(Yi≤Y)/N,F?y=∑i=1n I(Yi≤Y)/n,Fx=∑i=1N I(Xi≤X)/N,F?x=∑i=1n I(Yi≤Y)/n。
为了获得所有考虑的估计器的偏差和MSE的表达式,我们使用了以下误差项:
e0 = F?y - Fy / Fy,
e1 = F?x - Fx / Fx,
E(ei) = 0, i=0,1。
E(e02) = λCFy2,
E(e12) = λCFx2,
E(e0e1) = λρFyFxCxFy,
??SFy2 = ∑i=1N {I(Yi≤Y) - Fy}2 / N?1,
SFx2 = ∑i=1N {I(Xi≤X) - Fx}2 / N?1,
C?y2 = SFy2 / Fy2,
C?x2 = SFx2 / Fx2,
ρFyFx = ∑i=1N [{I(Yi≤Y) - Fy} / {I(Xi≤X) - Fx}],
λ = (1/n?1) / N。
3. 现有的估计器
在本节中,我们介绍了一些众所周知的现有估计器及其估计总体比例的属性,即偏差和MSE:
(1) 常用的总体比例估计器为:
Fusual = ∑i=1n I(Yi≤Y)/n
(2) 常用的总体比例比率估计器(由Cochran, 1940提出)及其属性为:
FRatio = F?y / (FxF?x)
Bias(FRatio) ? λFy[CFy2?λρFyFxCxFy],
MSE(FRatio) ? λFy2[CFy2+CFx2?2λρFyFxCxFy]
(3) Murthy, 1964提出的总体比例乘积估计器及其属性为:
FProd = F?y / (F?xFx)
Bias(FProd) ? λFy(ρFyFxCxFy?1/4CFx2),
MSE(FProd) ? λFy2[CFy2+CFx2+2ρFyFxCxFy]
(4) 带有方差的总体比例回归估计器为:
FReg = F?y + d1(Fx?F?x)
Var(FReg) ? λFy2 / (1?ρFyFx2)
(5) Bahl & Tuteja, 1991开发的指数比率和乘积估计器为:
FExpR = F?yexp(Fx?F?xFx+F?x)
FExpP = F?yexp(F?x?FxF?x+Fx)
Bias(FExpR) ? λFy(3/8CFx2?1/2ρFyFxCxFy)
MSE(FExpR) ? λFy2(CFy2+1/4CFx2?ρFyFxCxFy)
(6) Rao, 1991和Gupta等人提出的差分类型估计器为:
FD1 = K1F?y + K2(Fx?F?x)
FD2 = [K3F?y + K4(Fx?F?x)](FxF?x)
其中K1, K2, K3和K4是常数。
FD1和FD2的属性为:
Bias(FD1) = ?λFyCFy2(1?ρFyFx2) / (1+λCFy2(1?ρFyFx2))
Bias(FD2) = λFy[?CFy2(1?ρFyFx2)?λCFy2CFx2+CFy{ρFyFx?(1?λCFy2)ρFyFxCx} / (1?λCFy2ρFyFx2)
MSE(FD1) = λFy2CFy2(1?ρFyFx2) / (1+λCFy2(1?ρFyFx2))
MSE(FD2) = λFy2(1?λCFy2)CFy2(1?ρFyFx2) + λCFy2(1?ρFyFx2)
4. 提出的估计器类别
需要注意的是,总体分布函数的估计是统计分析的关键要素,因为它提供了关于研究变量的所有概率信息。分布函数可以确定累积概率、分位数和尾部风险,而不仅仅是像均值或方差这样的单参数度量。在各种应用领域,完整的分布对于理解整体情况并做出正确决策非常重要。环境和辐射研究中的暴露水平通常变化很大且偏斜,极值的比例很小,但它们对健康有显著影响。估计总体暴露可能会掩盖一部分超过安全限制的总体。同样,异质性和重尾行为是财务会计和经济分析中收入、利润和资产价值等变量的特征。在这种情况下,应该很好地估计分布函数以确定不平等、财务风险和绩效分散。尽管这一点很重要,但大部分调查抽样文献都集中在改进中心趋势的估计器上,而不是总体分布函数。简单随机抽样的经验分布是最受欢迎的,但它未能利用通常可用的辅助信息。因此,当处理高度多样化的总体时,它可能效率不高。已知的相关变量的总体参数已被证明可以提高对均值和总量的估计器的效率。然而,它系统地应用于总体分布函数的估计方面的应用并不广泛。此外,许多现有的调整估计器在不考虑相关结构或总体属性的假设下得出。受到Elkalzah等人(2025年)的启发,我们开发了一类使用辅助属性的总体比例估计器:
F?prop? = [W1F?y + W2(Fx?F?x)] / [(aFx + baF?x+b)^(1/2)[exp(a(Fx?F?x)a(F?x+Fx)+2b)+exp(a(Fx?Fx)a(F?x+Fx)+2b)]
定义误差e0 = F?y - Fy / Fy,e1 = F?x - Fx,E(ei) = 0, i=0,1。
解方程(21)得到误差项:
F?prop? = [W1Fy(1+e0) + W2(Fx?Fx(1+e1))] / [(aFx + baFx(1+e2)+b)^(1/2)[exp(a(Fx?Fx(1+e1))a(Fx(1+e1)+F2)+2b)+exp(a(Fx(1+e1)?Fx)a(Fx(1+e1)+Fx)+2b]]
简化后得到:
F?prop? = [W1Fy(1+e0)?FxW2e1] / (1?θe1+θ2e1^(1/2))
将方程(23)一阶近似后得到:
P?prop??Fy = W1Fy?W1Fyθe1 + W1Fye0?W2Fxe1 + 9/8W1Fxe1^2?W1Fyθe1+W2Fxθe1^2?Fy
对(24)两边取期望值得到F?prop?的偏差:
Bias(F?prop?) = (W1?1)Fy + 9/8W1Fyθ2λCFx2?W1P1θλρFyFxCxFy+W2FxθλCFx2
对(24)取平方并取期望值得到F?prop?的MSE:
MSE(F?prop?) = W12Fy2?2W1Fy2+W12Fy2λCFy2+2W1Fy2θλρFyFxCxFy?2W2FyFxθλCFx2+W22Fy2λCFx2+4W1W2Fy2Fx2θλCFx2?2W1W2Fy2Fx2λρFyFxCxFy?9/8W1Fy2λCFx2+1/34W12Fy2λCFx2+Fy2
对W1和W2求导并设为零,得到最优值:
?W1(opt) = C?22 / [1+7B11{λCFx2θ2+4λCFx2B11+4λ2ρFyFx2CFy2CFx2}]
其中?B11 = 1?C?22θ2W2(opt) = P12P2[λρFyFxCxFy+7λρFyFxCyCFxA11?8λCFx2θA11+8λCFy2λCFx2?8λ2ρFyFx2CFy2CFx2]{λCFx4θ2+4λCFx2A11+4λCFy2CFx2?4λ2ρFyFx2CFy2CFx2}
将W1(opt)和W2(opt)代入(26)得到最小均方误差:
MSE(F?prop?)min = Fy2 / (16[64B11(1Fy2)var(FReg)?CFx4θ4CFx2θ2+4B11+4(1Fy2)var(FReg)]
5. 数值研究
进行了数值研究,以检查所提出的估计器和现有估计器在辐射科学和财务会计领域的五个实际数据集上的效率。这项研究旨在通过实验证据支持上述理论上的效率提升。在调查抽样中,均方误差(MSE)常用于衡量估计器的准确性。MSE用于估计估计值与实际总体值之间的平均平方误差。它是估计器变异性和偏差的表示。MSE较小的估计器被认为更有效,因为它更接近实际总体分布函数。百分比相对效率(PRE)也被用作与MSE相比的比较指标。当PRE值高于100时,表示估计器比标准估计器更有效;当PRE值低于100时,表示估计器效率较低。PRE值的增加表明估计精度有所提高。
数值研究将评估所提出的类别在应用于各种实际总体时是否能产生更低的MSE和更高的PRE。鉴于数据集的频繁变化和偏斜,辐射和财务会计数据为评估估计器的强度和灵活性提供了方便的环境。
总之,这项数值研究通过显示所提出的估计器类别具有最小的均方误差和显著更高的百分比相对效率,证实了理论结果,优于所有考虑的总体。
人口-I:[来源(Aloraini等人,2025年):
Y =
为了获得新药物甲虫的非选择包测试。
X =
Stegobium的幼虫。
N = 20;n = 7;Fy = 0.5;Fx = 0.5;λ = 0.09285714;ρFyFx = ?0.4;CFy = 1.025978;CFx = 1.025978
人口-II:[来源(El-Saeed等人,2025年):
Y = 薄荷,经过辐照或未辐照。
X = 在选择-非包实验中的Stegobium成虫。
N = 21;n = 8;Fy = 0.4761905;Fx = 0.4761905;λ = 0.07738095;ρFyFx = 0.6181818;CFy = 1.074709;CFx = 1.074709
人口-III:[来源(Alomani等人,2025年):
Y = 薄荷,经过辐照或未辐照。
X = Stegobium的成虫。
N = 21;n = 8;P1 = 0.4761905;P2 = 0.4285714;λ = 0.07738095;ρFyFx = ?0.8257228;CFy = 1.074709;CFx = 1.183216
人口-IV:[来源:(https://www.kaggle.com/datasets/adebayo/stellar-cryptocurrency-dataset.)]
Y = 交易日的最高价格。
X = 交易日的最低价格。
N = 1514;n = 300;Fy = 0.4405548;Fx = 0.4471598;λ = 0.002672831;ρFyFx = 0.9653033;CFy = 1.127255;CFx = 1.112274
人口-V:[来源:(https://www.kaggle.com/datasets/adebayo/stellar-cryptocurrency-dataset.)]
Y = 交易日的最高价格。
X = 最后一笔交易的价格。
N = 1514;n = 300;Fy = 0.4405548;Fx = 0.4464993;λ = 0.002672831;ρFyFx = 0.9719719;CFy = 1.127255;CFx = 1.11376
6. 仿真研究
为了评估所提出估计器的效率、一致性和强度,进行了蒙特卡洛仿真研究。这项仿真实验的目的是在几种受控情况下对所提出的估计器和文献中考虑的现有估计器进行深入的比较分析。设置旨在反映总体的各种特征,包括不同类型的分布、相关结构和样本大小。通过这种结构,可以全面探索估计器在理想和非理想情况下的性能。当估计器的属性在分析上不可行或过于复杂时,广泛使用蒙特卡洛仿真进行统计推断和抽样理论。该过程通常进行数千次,以获得统计一致性和结果的可靠性。然后使用两种常用的效率度量(均方误差(MSE)和百分比相对效率(PRE)来分析估计器的性能。MSE用于估计估计器与真实总体参数的平均偏差,因此MSE是偏差和变异性的度量。MSE越小,估计器越理想。现在通常用PRE与基准估计器(通常是标准无偏估计器)进行比较,PRE值大于100表示所考虑的估计器优于基准估计器。仿真实验通过包括总体分布的系统变化、研究变量与辅助变量之间的交互程度以及样本大小,深入了解了所提出估计器在各种实际情况下的表现。这不仅证明了它相对于任何可用估计器的有用性,还表明它是稳健的,可以用于实际应用。
为了创建数据结构的多样性,创建了三个有限的人口N = 1500,每个基于不同的概率分布:
人口I:(正态分布):X = Normal(50, 10)
人口II:(均匀分布):X1 = Uniform,Y = 带噪声的线性模型
人口III:(指数分布):X服从指数分布,Y也以类似方式分布
本研究中应用的抽样设计是简单随机抽样不放回(S样本大小的多样性将允许我们进行深入分析,了解随着关于样本信息的积累,估计器效率的提高情况,以及所提出的估计器在小型和中等样本量情况下是否可能更加高效。此外,为了确保模拟结果的可靠性和稳定性,所有实验设置都重复进行了1000次。
7. 讨论
表2显示了基于五个真实总体(总体I-V)的现有估计器和建议估计器类别的均方误差(MSE)(见表1)。我们还通过模拟研究展示了所有考虑到的估计器的效率。研究结果清楚地表明,与传统的估计器相比,使用所提出的估计器类别可以获得显著的效率提升。首先,常规估计器在所有总体中的MSE值都相对较高。例如,在总体I中,其MSE为0.0244,在总体IV和总体V中为0.0006591982。这表明在没有使用辅助信息的情况下,估计器的效率较低。
表1. 建议的估计器类别的一些成员。
abF?prop?10F?prop1?N?FxF?prop2?N?Fx2F?prop3?n?FxF?prop4?n2?Fx2F?prop5?n2?FxF?prop6?
表2. 使用真实数据集的估计器的MSE。
估计器 总体I 总体II 总体III 总体IV 总体V
Fusual 0.0244 0.0202 0.000659 0.000659
FRatio 0.0684 0.0154 0.0816 4.525 2.56e-05
FProd 0.0293 0.0655 0.0079 0.0025 5.673
FReg 0.0205 0.0125 0.0064 4.495 0.48e-05
FExpR 0.0403 0.0128 0.0448 0.0001 9.777
FExpP 0.0207 0.0378 0.0079 0.0014 5.160
FD1 0.0189 0.0118 0.0062 7.440 0.07e-05
FD1 0.0188 0.0118 0.0063 8.197 4.493
F?prop1? 0.0017 0.0009 0.0004 7.814 5.979
F?prop2? 0.0017 0.0008 0.0004 7.143 5.860
F?prop3? 0.0017 0.0009 0.0004 8.518 6.860
F?prop4? 0.0017 0.0009 0.0004 7.143 5.860
F?prop5? 0.0017 0.0009 0.0004 8.518 6.860
F?prop6? 0.0017 0.0009 0.0004 7.143 5.860
回归估计器在现有估计器中平均而言优于比例和乘积估计器。例如,在总体III中,其MSE为0.006448,而FRatio(0.08168)和FProd(0.007984)的MSE都较大。同样,指数类型的估计器在某些组中显著提高了效率,但在所有数据集中并没有一致更好的结果。估计器FD1和FD2在MSE上也优于经典估计器,在总体I中的MSE约为0.0188-0.0189,在总体IV和V中约为4.49×10^-5。然而,这些改进并没有将其MSE降低到比所提出的估计器更低的水平。
表2最重要的结果是前六个提出的估计器的MSE显著下降。这些估计器在所有五个总体中的MSE值都非常小。例如,在总体I中,MSE小于0.024436(常规估计器),而提出的估计器的MSE为0.00172。在总体III中,MSE从0.020266(常规估计器)降低到0.000471(回归估计器)。在总体IV和V中,MSE降低到了10^-8的数量级,这比传统估计器的10^-5到10^-3的数量级有了极大的效率提升。此外,一些提出的估计器(特别是第二个、第四个和第六个)给出了相同或几乎相同的最低MSE值,这意味着所提出的类别在内部是稳定的,并且选择了最佳参数。
总体而言,表2清楚地证实了理论研究的结果。可以看出,所提出的估计器类别在所有真实数据集中总是优于传统的比例、乘积、回归估计、指数估计和D型估计器。MSE的显著降低证明了其稳健性和实际应用的优越性。这些发现对于所提出的广义类别在估计总体分布函数方面的有效性和灵活性非常有鼓舞作用。表3给出了许多估计器相对于常规估计器的相对效率百分比(PRE),其中PRE=100是基准值,p(i, j)是总体I和总体II同时发生的概率。PRE衡量了估计器相对于传统经验分布函数的效率提升,较高的值意味着效率提高。根据该表可以注意到,大多数修改后的估计器在某种程度上都优于标准估计器。例如,回归估计器的效率提升很大,在总体I中为119,在总体V中为1809。同样,差分类型的估计器也更高效,在总体V中的PRE值为1809.8。这表明使用辅助信息可以显著提高估计效果。估计器的表现参差不齐,在总体IV(1456.7)和V(1800.9)中表现优异,而在总体I(35.7)和III(24.8)中表现较差,这意味着其性能对研究变量和辅助变量之间的结构和分布非常敏感。同样,乘积估计器在总体III中的表现较高(253.8),但在其他总体中的效率较低,这表明其稳健性较差。指数比例和乘积类型的估计器在大多数总体中提供了中等的效率提升,PRE值介于45到352之间。尽管这些估计器比常规估计器更好,但它们的效率不如回归或差分类型估计器。最令人印象深刻的发现是在所提出的估计器类别中。这些估计器的效率非常高,PRE值在总体I中约为1400,在总体V中超过1,430,000。这些巨大的提升体现了所提出类别在多样化人群中的强大能力、灵活性和高性能。所提出的估计器不同版本之间的微小差异是由于内部参数的变化,但所有估计器的PRE都非常高,这支持了最小均方误差的理论结果。我们还使用图1中的折线图来可视化数值结果。
表3. 使用真实数据集的估计器的PRE。
估计器 总体I 总体II 总体III 总体IV 总体V
Fusual 100 100 100 100 100 100 FRatio 35.7 142 91 30.9 24 24.8 120 31 45 67 09 18 0.88 1
FProd 83.3 33 33 30.8 88 25 3.8 46 22 53 84 62 25 66 15 8
FReg 119 04 76 16 1.8 51 33 14 28 57 14 66 49 91 82 53 82 56 15 8
FExpR 60 60 60 61 58 27 34 45 24 34 37 16 35 24 68 45 36 40 8
FExpP 117 64 71 53 52 79 82 53 84 62 45 39 96 45 36 40 8
FD1 128 82 21 11 70 78 88 32 32 14 66 83 18 09 62 22 11 71 66 97 11 80 9.6 22 11 71 66 97 11 80 9.7 69
下载:下载高分辨率图像(559KB)
下载:下载全尺寸图像
图1. 显示了使用真实数据集的MSE和PRE。
总体而言,表3清楚地表明,所提出的估计器类别在所有真实数据集中的表现显著优于现有估计器。它们令人印象深刻的PRE值表明,它们不仅在理论上有效,而且在实际应用中也非常适用,例如环境和财务数据(这些数据具有变量和偏态分布)。基于不同样本大小的模拟研究的数值结果详细列在表4、表5、表6、表7和表8中。我们使用图2中的折线图展示了模拟的数值结果。
表4. 显示了使用基于正态分布的蒙特卡洛模拟,针对不同样本大小的所有考虑到的估计器的MSE结果。
估计器 n = 100 n = 200 n = 300
Fusual 0.0023 0.0010 0.0006 7
FRatio 0.0023 0.0010 9 0.0006 6
FProd 0.0070 50 0.0032 5 0.002
FReg 0.0017 20 0.0008 10 0.0005 5
ExpR 0.0006 30 0.0006 8 0.0006 9
FExpP 0.0003 20 0.0009 5 0.0006 6
FD1 0.0021 90 0.0023 80 0.0021 6
FD2 0.0002 70 0.0005 5 0.0004 9
F?prop? 0.0002 34 6 1 E-05 4.6 E-05
表5. 显示了使用基于正态分布的蒙特卡洛模拟,针对不同样本大小的所有考虑到的估计器的PRE结果。
估计器 n = 100 n = 200 n = 300
Fusual 100 100 100 FRatio 10 3.48 81 10 1.45 61 10 1.50 3
FProd 32 98 33 27 3 3
FReg 137 53 13 50 9 13 4.7 43
ExpR 72 62 25 11 4 27 10 1.5 2
FExpP 10 63 24 54 3 0.9 1
FD1 85 16 51 19 8 35 13 5 9
FD2 86 44 19 8 35 13 5 9 2
F?prop? 18 20 89 17 14 84 16 83 5 9
表6. 显示了使用基于均匀分布的蒙特卡洛模拟,针对不同样本大小的所有考虑到的估计器的MSE结果。
估计器 n = 100 n = 200 n = 300
Fusual 0.0023 30 0.0010 8 0.0006 7
FRatio 0.0007 9 0.0003 6 0.0002 2
FProd 0.0085 50 0.0039 7 0.0024 5
FReg 0.0007 10 0.0003 3 0.0002 2
ExpR 0.0010 10 0.0010 4 0.0011 3
FExpP 0.0011 50 0.0005 6 0.0014 3
FD1 0.0030 70 0.0036 7 0.0042 5
FD2 0.0008 0 0.0004 8 0.0008 4
F?prop? 0.0002 47 7 0 E-05 4.5 E-05
表7. 显示了使用基于均匀分布的蒙特卡洛模拟,针对不同样本大小的所有考虑到的估计器的PRE结果。
估计器 n = 100 n = 200 n = 300
Fusual 100 100 100 FRatio 33 9.7 13 20 85 9 31 22 7 27 27 2
FReg 36 97 58 34 8 9 43 40 9 9 6
ExpR 20 16 51 19 3 21 46 57 11 46 9 7
FD1 129 17 68 51 16 8 3 14 66 9 7
表8. 显示了使用基于指数分布的蒙特卡洛模拟,针对不同样本大小的所有考虑到的估计器的MSE结果。
估计器 n = 100 n = 200 n = 300
Fusual 0.0022 40 0.0010 4 0.0006 4
FRatio 0.0019 30 0.0009 0 5 5
FProd 0.0078 60 0.0036 3 0.0022 2
FReg 0.0014 0 0 10 4 0 0 1
ExpR 0.0022 50 0 22 5 0 23 1
ExpP 0.0025
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号