贝叶斯与非贝叶斯推断在逆幂XLindley分布中的应用,及其在工程和辐射数据领域的应用

《Journal of Radiation Research and Applied Sciences》:Bayesian and non-Bayesian inference for the inverse power induced XLindley distribution with applications to engineering and radiation data

【字体: 时间:2026年05月04日 来源:Journal of Radiation Research and Applied Sciences 2.5

编辑推荐:

  Hadeel AlQadi | Diaa S. Metwally | Raga Idress | Ahmed M. Felifel 数学系,贾赞大学科学学院,邮政信箱114,贾赞,45142,沙特阿拉伯王国 摘要 本文介绍了一种新型的双参数分布——逆幂诱导XLind

  Hadeel AlQadi | Diaa S. Metwally | Raga Idress | Ahmed M. Felifel
数学系,贾赞大学科学学院,邮政信箱114,贾赞,45142,沙特阿拉伯王国

摘要
本文介绍了一种新型的双参数分布——逆幂诱导XLindley(IPIXLN)模型,该模型性能优于传统分布。与传统分布相比,这种新分布提供了更为丰富的概率函数集。其密度函数和危险率函数的特点表明,该模型适用于多种类型的数据。本文研究了所提出分布的数学特性,包括分位数函数、Rényi熵、矩及其相关度量以及顺序统计量。通过深入的蒙特卡洛模拟,比较了几种用于估计模型参数的策略的有效性,包括最大似然估计(MLE)、贝叶斯估计(BE)和最大间隔乘积(MPS)。为了展示其实用性,将IPIXLN模型应用于工程和辐射领域的两个真实世界数据集。研究结果表明,与已知分布相比,该模型具有更好的拟合度和更高的灵活性。总体而言,研究结果证明了IPIXLN模型在描述寿命和可靠性数据方面的有效性,同时它是一个数学上易于处理且高度灵活的分布,为连续概率分布家族做出了重要贡献。

1. 引言
在许多应用领域中,数据分析与科学推断的基础之一是概率分布的统计应用。基于概率分布的概率特性,它们是描述随机事件行为和阐明数据变异性的关键工具。这些分布使研究人员能够检验假设、估计参数,并确定哪些模型最能捕捉现实世界的数据。通过对设备寿命、患者生存时间、故障率和环境条件等随机事件的研究和分析,特别是在医学、工程、生物科学和经济学等实际领域中,概率分布发挥了重要作用。此外,通过提供精确的建模能力和预测未来系统行为的能力,概率分布有助于基于证据的决策制定。为了提高科学研究的质量和各种应用领域中决策的有效性,人们不断研究并实践新的统计分布。这有助于扩展统计知识,并创建更准确、更通用的工具来分析真实数据。

逆幂诱导XLindley(IPIXLN)模型的目标是评估具有潜在非单调危险率(HRF)的数据,这种危险率可能存在于“浴缸形”分布、单峰分布或“倒置浴缸形”分布中。这是因为许多应用(如癌症和死亡率研究)可能不具备单调危险率。这种调整还增加了对重尾特征的识别。目前,处理数据集中固有变异性的常见策略是修改现有模型。通过扩展和修改现有的分布模型,研究人员最近开始探索新的模型。研究变量的幂变换是最重要的方法之一,而形状参数使结果分布更加灵活(Box & Cox, 1964)。许多领域,如生物科学、寿命测试问题、化学数据和医学科学,都依赖于这种变换后的分布。这种方法产生了许多新的灵活分布,包括逆幂熵Chen分布(Rammadan等人,2025年)、逆幂诱导Ailamujia模型(Abdelwahab等人,2025年)、逆幂Zeghdoudi分布及其特性和应用(Elbatal等人,2024年)、逆Kumamaraswamy分布(Abd等人,2017年)、逆指数化Lomax分布(Elmorsy & Hassan,2019年)、倒置Nadarajah-Haghighi分布(Tahir等人,2018年)、倒置Topp-Leone分布(Hassan等人,2020年)、逆Xgamma分布(Yadav等人,2021年)、逆幂Ishita分布(Frederick等人,2022年)、半逻辑倒置Topp-Leone分布(Bantan等人,2021年)、在多重截尾数据下对逆Lomax分布的熵估计(Bantan等人,2020年)、半逻辑逆Rayleigh分布(Almarashi等人,2020年)、逆单位Teissier分布(Alsadat等人,2023年)、Kavya–Manoharan逆长度偏置指数分布(Alotaibi等人,2022年)、使用渐进式I型截尾方案估计逆Weibull分布(Algarni等人,2021年)、正弦半逻辑逆Rayleigh分布(Shrahili, Elbatal, & Elgarhy,2021年)、正弦逆指数分布(Shrahili, Elbatal, Almutiry, & Elgarhy,2021年)、Shrahili, Elbatal, Almutiry, & Elgarhy,2021年)以及截断的Cauchy幂逆Topp-Leone分布(Mohamed等人,2023年)。在另一项研究中(Alomani等人,2025年;El等人,2022年,2023年),探讨了矩指数分布、逆幂Ishita分布和逆幂Ailamujia分布的截断形式及其在各种领域中的应用。此外(Elgarhy等人,2023年),还提出了在逐步II型截尾数据下的截断逆幂Lindley分布。

文献中包含了众所周知的Lindley分布的变体,例如XLindley分布。目前,一些研究者正在研究XLindley分布的改进版本。XLindley分布(XLN)结合了指数分布和Lindley分布的特点,在近年来成为一种流行的统计模型,为建模不同类型的数据提供了更大的灵活性。XLN分布最初由Chouia和Zeghdoudi提出(Chouia & Zeghdoudi,2021年),引起了研究人员的广泛兴趣。这种结合了Lindley分布和指数分布的分布具有显著的概率特性,包括分位数函数、最大似然方法、矩估计法和随机排序(Khodja等人,2022年)。Khodja等人将截断XLindley分布引入生存分析领域,重点关注截尾数据下的参数估计。为了估计潜在参数,他们采用了结合传统最大似然和贝叶斯技术的双重策略。Ahsan-ul等人(2022年)引入了Poisson XLindley分布,以研究不同的统计和可靠性方面,并将其应用范围扩展到计数数据。在描述XLindley分布时,他们通过将其应用于实际数据(如冠状病毒感染患者的生存时间)展示了该分布的实用性。Gemeay等人(2023年)引入了改进的XLindley分布,并证明了其能够匹配寿命数据。Altun等人(2017年)还研究了具有特定特性的奇数Burr Lindley分布及其应用。

所提出的模型在模拟具有非单调危险率的数据方面具有高度灵活性,这在寿命分析、生物数据和医学数据等应用中很常见,因为故障率可能随时间变化。该模型能够捕捉不同的形状,例如基于潜在条件或生物因素变化的浴缸形危险率或模式。它在可靠性分析、生物学和经济学等领域能够表示各种类型的数据,而在这些领域中传统分布往往不够适用。其灵活性使其特别适用于表示具有复杂尾部行为或时间依赖性故障率的现象。与传统分布(如Lindley和XLindley)相比,所提出的分布提供了额外的功能,允许对不符合典型模式的数据进行建模或修改现有分布。这使得它更适合处理复杂的现实世界数据,尤其是在传统模型不足的情况下。

所提出的分布是Singh和Das(Singh & Das,2020年)研究的加权分布的一个变体。其概率密度函数(PDF)表示为:
$$f_I(y) = \frac{1 - F(y)}{E(y)}$$
其中$E(y)$是随机变量Y的期望值,$F(y)$是累积分布函数(CDF)。利用诱导分布的概念,Singh和Das(Singh & Das,2020)提出了Garima分布的变体——诱导Garima分布。Panta等人(2025年)最近引入了Bilal分布的另一种变体。将XLindley分布的函数代入公式(1),可以得到诱导XLindley(IXLN)模型的公式:
$$f(y; \theta) = \theta \cdot \left(1 + \theta\right)^2 \cdot \left[\left(1 + \theta\right)^2 + \theta y\right] e^{-\theta y}, \quad y > 0, \theta > 0$$
因此,与公式(2)相关的CDF为:
$$F(y; \theta) = \frac{1 - \left(1 + \theta y\right)^{\left(1 + \theta\right)^2}}{e^{-\theta y}}, \quad y > 0, \theta > 0$$

IPIXLN模型不仅仅是Lindley家族的另一个扩展,它还解决了在生存分析和可靠性研究中常见的非单调危险率和重尾数据建模的特定挑战。与Weibull或Gamma等传统模型不同,IPIXLN在处理具有复杂行为的数据集(如变化故障率或偏态分布)时提供了更大的灵活性。这使得它在医学生存研究和工程可靠性等实际应用中成为更准确和实用的选择。由于逆幂诱导XLindley分布能够有效反映异构数据集并在拟合现实世界观测值时提供更大的灵活性,因此使用它非常重要。理解事件发生时间的行为在生物建模、医学生存研究和可靠性分析中至关重要,其可解释性和分析简便性使其成为这些领域中的有用工具。

研究的后续部分结构如下:第2节主要关注IPIXLN分布的构建;第3节分析IPIXLN模型的统计特性及其理论基础;第4节讨论用于IPIXLN模型的参数估计策略,强调不同估计方法的适应性;第5节描述了模拟研究,包括模拟实验的设计和对数值结果的全面分析,以评估所提出估计方法的有效性;第6节将提出的方法应用于两个真实世界数据集,展示了它们在实际情况中的实用性和有效性;第7节总结了主要研究结果。

2. 逆幂诱导XLindley分布
本节介绍了IPIXLN模型,并讨论了其额外的形状参数α。给出了PDF和CDF的图形表示和表达式。通过应用变换$X = Y^{-1}\alpha$(其中Y遵循IXLN模型,由Rammadan等人(2025年)和Abdelwahab等人(2025年)定义),可以构建IPIXLN模型:
$$f(x; \theta; \alpha) = \alpha \theta^2 \cdot \left(1 + \theta\right)^2 \cdot x^{-\alpha - 1} \cdot \left(\theta + 2 + x^{-\alpha}\right) e^{-\theta x^{-\alpha}, \quad x > 0, \theta, \alpha > 0$$
$$F(x; \theta; \alpha) = \frac{1 - \left(1 + \theta x^{-\alpha}\right)^{\left(1 + \theta\right)^2}}{e^{-\theta x^{-\alpha}}, \quad x > 0, \theta, \alpha > 0$$
图1展示了选定θ和α值的IPIXLN分布的PDF和CDF。对于所示的参数设置,PDF是单峰且右偏的。图表还表明,密度形状随θ和α的变化而变化,特别是在分布范围和峰值高度方面。随着参数值的增加,分布变得更加分散,峰值降低。这些图表说明了所提模型的参数依赖性形状灵活性。此外,对于所有选定的参数值,IPIXLN的CDF图是一个递增函数。

例如,在研究任何寿命现象时,从生存函数(SF)和危险率函数(HRF)获得的特性非常有用。任何寿命设备的SF和HRF是评估老化和相关特征的主要工具。使用公式(4)和(5),可以分别表示IPIXLN模型的SF和HRF形式:
$$S(x; \theta; \alpha) = 1 - F(x; \theta; \alpha) = \frac{1 - \left(1 + \theta x^{-\alpha}\right)^{\left(1 + \theta\right)^2}}{e^{-\theta x^{-\alpha}}$$
$$h(x; \theta; \alpha) = f(x; \theta, \alpha) = \alpha \theta^2 \cdot \left(1 + \theta\right)^2 \cdot x^{-\alpha - 1} \cdot \left(\theta + 2 + x^{-\alpha}\right) e^{-\theta x^{-\alpha}$$
图2展示了选定θ和α值的IPIXLN模型的生存函数和危险率函数。危险率随参数值的变化而变化,表明其行为依赖于参数,而不是在整个参数空间内均匀分布。这些图表说明了该模型在表示不同寿命行为方面的潜在灵活性。该图表明,对于所有选定的参数值,SF呈现出递减的形状。

3. 基本特性
这些特性对于理解分布的行为、促进参数估计以及在需要建模有界或偏态数据的实际应用中至关重要。它们提供了关于分布结构、尾部行为以及模型可靠性影响的见解,使其成为统计建模的强大工具。3.1. 矩矩矩矩提供了关于分布的中心、离散度、不对称性和尾部重量的基本信息。通过测量这些元素,它们有助于我们理解数据的一般结构和变异性,这在金融、环境研究和质量控制等领域至关重要。考虑一个遵循IPIXLN分布的随机变量X,其概率密度函数(PDF)为(4),那么第r阶矩的一般表达式表示为:μr` = ∫0∞x^rf(x;θ,α)dx = αθ^2(1+θ)^2 ∫0∞x^(r?α?1)(θ+2+x?α)e^(-θx?α) = θ^rα(1+θ)^2[θ(θ+2)Γ(1?rα) + Γ(2?rα)],其中r<α。γ是gamma函数。此外,将r = 1, 2, 3, 4代入方程(6),可以得到ipixln模型的前四个矩。以下信息可用于确定方差和前四个矩的相关性。μ1=θ^1α(1+θ)^2[θ(θ+2)Γ(1?1α) + γ(2?1α)],α>1,μ2 = θ^2α(1+θ)^2[θ(θ+2)Γ(1?2α) + Γ(2?2α)],α>2,μ3 = θ^3α(1+θ)^2[θ(θ+2)Γ(1?3α) + Γ(2?3α)],α>3,μ4 = θ^4α(1+θ)^2[θ(θ+2)Γ(1?4α) + Γ(2?4α)],α>4,以及σ2 = μ2`?(μ1`)^2 = θ^2α(1+θ)^2[θ(θ+2)Γ(1?2α) + Γ(2?2α)]?[θ1α(1+θ)^2[θ(θ+2)Γ(1?1α) + Γ(2?1α)]^2,α>2。表1展示了与IPIXLN模型相关的关键统计矩和参数的全面数值数据。结果表明,对于恒定的α值,均值和第二矩随着参数θ的增加而增加,表明分布向更大的值偏移。结果还表明,所有参数组合的偏度都是正的,表明分布是右偏的。此外,峰度值显著较高,表明存在重尾。变异系数(CV)和离散度指数(ID)显示了不同参数配置下分布的特性。由于偏度和峰度分别需要第三和第四矩的存在,因此表中的数值仅适用于α > 4的参数设置,这保证了所有列出的基于矩的度量的存在。另外,图3展示了IPIXLN模型的几个关键统计量的三维表示,包括均值、方差、偏度、峰度和变异系数。表1. 一些计算出的矩及其相关度量值。θ α μ1 μ2 σ2 SD 偏度 CV ID D1.5 4.2 6.4 18 13 57.5 65 33 16.3 73 91 7.7 86 92 1.5 72 42.7 71 44 9.2 94 4.5 6.7 28 23 83.9 72 93 8.7 03 91 8.4 03 92 0.9 00 22.7 35 50.3 40 75.2 7.4 20 94 45.1 92 53 90.1 23 19.7 51 9.5 74 52.6 61 65 2.5 71 11 5.5 7.7 06 04 71.2 74 84 11.8 91 92 0.29 51 19.0 88 32.6 37 53.4 50 61.8 4.2 4.29 61 99.1 01 18 0.64 49 8.9 80 33 1.7 50 52.0 90 31 84.5 4.47 26 10 6.20 98 86.2 05 59.2 84 73 0.85 00 2.07 59 19.2 74 15.24.86 30 12 2.63 96 98.9 90 49.9 49 29.0 65 72.0 45 92 0.35 56 5.5 02 24 12 9.62 02 10 4.39 60 10.21 74 28.40 84 20.78 62 2.24.23.07 32 26.25 00 16.80 55 4.09 94 37.5 05 71.33 39 5.46 84 4.53.17 68 27.97 26 17.88 07 4.22 86 36.69 39 1.33 11 5.62 86 5.23.40 34 31.92 03 20.33 72 4.50 97 35.06 59 1.32 51 5.53.49 50 33.58 48 21.36 99 4.62 28 34.45 93 1.32 27 6.11 45 2.54.22.60 46 13.40 31 6.61 91 2.57 28 31.65 07 0.98 78 2.54 13 4.52.68 17 14.19 95 7.00 78 2.64 72 31.17 56 0.98 71 2.61 31 5.22.84 95 16.00 89 78 83 2.80 88 30.21 04 0.98 57 2.76 87 5.52.91 69 16.76 59 8.25 75 2.87 36 29.84 65 0.98 51 2.83 09 2.84.22.30 40 8.48 92 3.18 08 1.78 35 22.16 35 0.77 41 1.38 06 4.52.36 48 8.94 24 3.35 00 1.83 03 21.96 94 0.77 40 1.41 66 5.22.49 65 9.96 34 37.50 57 1.33 39 5.46 84 4.53.17 68 27.97 26 17.88 07 4.22 86 36.69 39 1.33 11 5.62 86 5.23.40 34 31.92 03 20.33 72 4.50 97 35.06 59 1.32 51 5.53.49 50 33.58 48 21.36 99 4.62 28 34.45 93 1.32 27 6.11 45 2.54.22.60 46 13.40 31 6.61 91 2.57 28 31.65 07 0.98 71 15.57.70 60 47 1.27 48 41 11.89 19 20.29 51 19.0 88 32.63 37 53 45 06 10 40.98 57 25 12 94 51.0 53 50.34 07 5.27 42 09 44 5.19 25 39 0.12 32 19.75 15 19.57 45 2.66 16 52.57 11 5.57.70 60 47 1.27 48 41 11.89 19 20.29 51 19.0 88 32.63 37 53 45 06 10 40.98 57 25 12 94 51.0 53 50.34 07 55.27 42 09 44 5.19 25 39 0.12 32 19.75 15 19.57 45 2.66 16 52.57 11 5.57.70 60 47 1.27 48 41 11.89 19 20.29 51 19.0 88 32.63 37 53 45 06 10 40.98 57 25 12 94 51.0 53 50.34 07 55.27 42 09 44 51.0 53 50 33.58 48 21.36 99 4.62 28 34.45 93 1.32 27 6.11 45 2.54.22.60 46 13.40 31 6.61 91 2.57 28 31.65 07 0.98 71 12.61 31 5.22.84 95 16.00 89 78 83 2.80 88 30.21 04 0.98 57 2.76 87 5.52.91 69 16.76 59 8.25 75 2.87 36 29.84 65 0.98 51 2.83 09 2.84.22.30 40 8.48 92 3.18 08 1.78 35 22.16 35 0.77 41 1.38 06 4.52.36 48 8.94 24 3.35 00 1.83 03 21.96 94 0.77 40 1.41 66 5.22.49 65 9.96 34 37.50 57 1.33 39 5.46 84 4.53.17 68 27.97 26 17.88 07 4.22 86 36.69 39 1.33 11 5.62 86 5.23.40 34 31.92 03 20.33 72 4.50 97 35.06 59 1.32 51 5.97 55.53.49 50 33.58 48 21.36 99 4.62 28 34.45 93 1.32 27 6.11 45 2.54.22.60 46 13.40 31 6.61 91 2.57 28 31.65 07 0.98 71 12 5.57.70 60 47 1.27 48 41 11.89 19 20.29 51 19.0 88 32.63 37 53 45 06 10 40.98 57 25 12 94 51.0 53 50.34 07 55.27 42 09 44 51.0 53 50.34 07 55.27 42 09 44 51.0 53 50 33.58 48 21.36 99 4.62 28 34.45 93 1.32 27 6.11 45 2.54.22.60 46 13.40 31 6.61 91 2.57 28 31.65 07 0.98 71 12 5.57.70 60 47 1.27 48 41 11.89 19 20.29 51 19.0 88 32.63 37 53 45 06 10 40.98 57 25 12 94 51.0 53 50.34 07 55.27 42 09 44 51.0 53 50 33.58 48 21.36 99 4.62 28 34.45 93 1.32 27 6.11 45 2.54.22.60 46 13.40 31 6.61 91 2.57 28 31.65 07 0.98 71 12 5.57.70 60 47 1.27 48 41 11.89 19 20.29 51 19.0 88 32.63 37 53 45 06 10 40.98 57 25 12 94 51.0 53 50.34 07 55.27 42 09 44 51.0 53 50 33.58 48 21.36 99 4.62 28 34.45 93 1.32 27 6.11 45 2.54.22.60 46 13.40 31 6.61 91 2.57 28 31.65 07 0.98 71 12 5.57.70 60 47 1.27 48 41 11.89 19 20.29 51 19.0 88 32.63 37 53 4在每次模拟迭代中,我们生成500个自助样本,并为马尔可夫链蒙特卡洛(MCMC)过程收集10,000个观测值。最初的1000个观测值被用作燃烧期,以减轻原始分布的影响。计算了不同参数值的估计值的相对偏差和均方误差(MSE)。表3、表4、表5、表6、表7、表8、表9、表10展示了模拟分析的结果。所有模拟结果都是通过用R编程语言编写的脚本生成的。选择的参数设置旨在代表各种实际场景,包括小样本量和偏态数据。我们解释了每种方法面临的挑战:最大似然估计(MLE)适用于大样本,但在小样本或重尾数据下表现不佳;贝叶斯估计(BE)在有先验知识的情况下更可靠;而MPSE在似然函数复杂时很有用。此外,我们还提供了每种方法表现更好的情况综合说明:MLE适用于大样本,BE在有先验信息时有效,而MPSE在似然函数难以最大化时有用。关于模拟研究,结果表明,虽然所有方法都提供了合理的估计值,但在某些情况下,特别是对于MPSE方法,其覆盖概率低于名义水平。因此,估计器的性能并非在所有情况下都一致,应谨慎解释。此外,模拟设计基于蒙特卡洛复制,而自助重采样仅用于MPS方法中的区间估计。

表3. 在θ=0.5和α=1.5n时IPIXLN模型的点估计方法结果
方法 θ α 平均值 MSEs RBIAS 平均值 MSEs RBIAS
50 MLE 0.50 39 0.0064 80.0077 61.53 0.0249 40.0202
BE 0.51 41 0.0066 10.0281 81.51 90.0231 70.0106
MPSE 0.52 75 0.0071 10.0550 91.4359 0.0257 6?0.0426 81

表4. 在θ=1.2和α=2n时IPIXLN模型的点估计方法结果
方法 θ α 平均值 MSEs RBIAS 平均值 MSEs RBIAS
50 MLE 1.22 73 0.0258 50.0227 62.0462 0.0536 90.0230 8
BE 1.23 28 0.0258 90.0273 22.0383 0.0515 90.0191
MPSE 1.21 62 0.0216 70.0134 61.9074 0.0534 6?0.0462

表5. 在θ=1.8和α=2.5n时IPIXLN模型的点估计方法结果
方法 θ α 平均值 MSEs RBIAS 平均值 MSEs RBIAS
50 MLE 1.86 17 0.0665 10.0343 0.2558 20.0857 60.0232 8
BE 1.8632 0.0665 50.0351 52.5509 0.0828 30.0203 5
MPSE 1.79 06 0.0500 7?0.0052 32.3836 0.0850 9?0.0465

表6. 在θ=2.5和α=3n时IPIXLN模型的点估计方法结果
方法 θ α 平均值 MSEs RBIAS 平均值 MSEs RBIAS
50 MLE 2.61 46 0.1696 90.0458 43.0696 90.1236 10.0232 3
BE 2.6083 0.1672 50.0433 13.0574 70.1188 60.0191
MPSE 2.45 19 0.1203 3?0.0192 32.8607 0.1226 5

表7. 在θ=0.5和α=1.5n时IPIXLN模型的区间估计方法结果
方法 θ α 下限 上限 CPs AWs 下限 上限 CPs AWs
50 MLE 0.37 08 0.6849 0.9600 3142 1.2578 1.8621 0.9350 6042
BE 0.36 49 0.6697 0.9450 3049 1.2248 1.8096 0.9450.5848
MPSE 0.39 96 0.7095 0.9100 3099 1.1303 1.6858 0.8550.5556

表8. 在θ=1.2和α=2n时IPIXLN模型的区间估计方法结果
方法 θ α 下限 上限 CPs AWs 下限 上限 CPs AWs
50 MLE 0.96 73 1.5573 0.9350 5901 1.6504 2.5369 0.9350.8865
BE 0.95 28 1.5282 0.9250 5754 1.6105 2.4711 0.9400.8605
MPSE 0.96 39 1.5143 0.9202 81.4694 0.0119 2?0.0203 91

表9. 在θ=1.8和α=2.5n时IPIXLN模型的区间估计方法结果
方法 θ α 下限 上限 CPs AWs 下限 上限 CPs AWs
50 MLE 1.46 03 2.3737 0.9200 9135 2.0574 3.1811 0.9350.8875
BE 1.43 05 2.3181 0.9250 5754 1.6105 2.2743 0.8950.7988
MPSE 1.40 89 2.2336 0.9350 82.5484 0.0189 0.0129 92

表10. 在θ=2.5和α=3n时IPIXLN模型的区间估计方法结果
方法 θ α 下限 上限 CPs AWs 下限 上限 CPs AWs
50 MLE 1.99 58 3.4263 0.9101 1.4304 2.4677 3.8187 0.9350.6223 2.1851 2.9772 0.9450.7872
BE 1.97 91 2.0789 0.9250 4754 1.6105 2.8850.4335
MPSE 1.98 67 0.0175 6?0.0101 92.4651 0.0288 5?0.0139 6

表11. 两个数据集的统计量摘要
数据集 I 数据集 II
均值 中位数 方差 偏度 峰度 范围 最小值 最大值
I 4 0.50 2.12 6.68 0 12.71 10.54 33 24 0.52 4.5
II 44 2.23 48 1.28 59.32 86 3.38 16.55 91 7.63 80.12 21 7.76

图5. 数据集I的一些非参数图
图6. 数据集II的一些非参数图

表12. 使用MLE对数据集I的模型估计结果
模型 θ α 估计值 (θ?) 标准误差 (SE(θ?) 估计值 (α?) 标准误差 (SE(α?)
IPIXLN 1.1985 0.1509 1.7724 0.2411
IXLN 0.3356 0.0457
XLN 0.3812 0.0442
IAL 0.1822 0.0257
Ex 0.2492 0.0394
We 0.9607 0.1089
Ga 1.0617 0.2101 3.7788

表13. 使用MLE对数据集II的模型估计结果
模型 θ α 估计值 (θ?) 标准误差 (SE(θ?) 估计值 (α?)
IPIXLN 0.9712 0.1033 0.9835
IXLN 0.5736 0.0739
XLN 0.6207 0.0711
IAL 0.3268 0.0439
Ex 0.4476 0.0675
We 0.9408 0.1008
Ga 1.0237 0.1926 2.1833

实际应用部分评估了IPIXLN模型的适应性和实际意义,通过两个实证数据集进行了展示。模型的性能通过多个图形研究得到了体现,这些研究清楚地展示了其与竞争模型相比在捕捉潜在数据模式方面的更强能力。通过将其应用于维护工程和辐射研究的数据集,进一步证实了其实用性,其中IPIXLN分布通常优于其他分布。由于其适应性,预计IPIXLN模型将在医学科学、工程学和经济学等多个领域发挥作用。数据集总结如下:
- 第一个数据集是空中通信收发器的维修时间,反映了现实世界的维护过程,其中故障通常频繁发生,但往往在短时间内得到修复(Jorgensen, 2012; Bantan et al., 2019)。时间以小时为单位。数据的偏度和重尾特性突显了模型处理高变异性和长尾分布系统的能力。数据如下:0.50, 0.60, 0.60, 0.70, 0.70, 0.70, 0.80, 1.00, 1.00, 1.00, 1.10, 1.30, 1.50, 1.50, 1.50, 2.00, 2.20, 2.50, 2.70, 3.00, 3.30, 4.00, 4.00, 4.50, 4.70, 5.00, 5.40, 5.40, 7.00, 7.50, 8.80, 9.00, 10.2, 22.0, 24.5。
- 第二个数据集最初由Efron(Efron, 1988)公开,显示了44名头颈癌(HNC)患者的生存期(以天为单位)。HNC包括多种头颈恶性肿瘤。数据呈正偏态,包含了接受放疗和化疗的44名患者的生存期。数据如下:0.122, 0.236, 0.237, 0.2587, 0.3198, 0.3700, 0.4135, 0.4738, 0.5546, 0.5836, 0.6347, 0.6846, 0.7447, 0.7826, 0.8143, 0.84, 0.92, 0.94, 1.1, 1.12, 1.19, 1.27, 1.3, 1.33, 1.4, 1.46, 1.55, 1.59, 1.73, 1.79, 1.94, 1.95, 2.09, 2.49, 2.81, 3.19, 3.39, 4.32, 4.69, 5.19, 6.33, 7.25, 8.17, 17.76。

表11总结了两个数据集的一些统计量。图5和图6使用分位数-分位数(QQ)图、小提琴图、箱线图、核密度估计和总测试时间(TTT)图来图形化展示数据集。两个数据集都明显右偏,具有较大的右尾和大多数观测值集中在较小值附近。箱线图中的多个异常值和QQ图与正态性的显著偏离表明了偏度的存在。此外,TTT图显示了危险率的上升趋势。

表12和表13展示了使用MLE对两个数据集的模型估计结果,以及置信区间的平均宽度(AWs)和覆盖概率(CPs)随样本量增加而减少的情况,表明区间估计在更大的数据集中具有更高的精度。同时,我们观察到在某些情况下,特别是在小样本量或偏态数据的情况下,区间覆盖率低于名义水平。这种行为并不罕见,可能受到数据特性或限制(如样本量)的影响。虽然模型通常提供准确的区间覆盖,但并不总能在所有条件下达到名义水平。因此,我们认识到所提出模型的性能可能对底层数据结构敏感,并在结论中反映了这种变异性。模拟分析表明,所有三种估计方法都能为所提模型的参数估计提供适当且稳定的结果。尽管如此,MLE和BE方法在减少偏差和估计效率方面通常表现略优于MPSE方法,但MPSE技术仍然是一个可行且可靠的替代选择。Felifel:写作——审稿与编辑;写作——初稿创作;软件;方法论;形式分析;概念化。
资金声明:
本研究得到了伊玛目穆罕默德·本·沙特伊斯兰大学(IMSIU)科研处(项目编号:IMSIU-DDRSP2601)的支持与资助。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号