一种基于分歧驱动的评估框架,用于在循环直觉模糊不确定性下进行群体决策分析
《Ain Shams Engineering Journal》:A divergence-driven evaluation framework for group decision analytics under circular intuitionistic fuzzy uncertainty
【字体:
大
中
小
】
时间:2026年05月10日
来源:Ain Shams Engineering Journal 5.9
编辑推荐:
陈廷宇
台湾桃园市龟山区文华一街259号长庚大学管理学院工业与商业管理系,邮编33302
**摘要**
在不确定性评估中量化差异是多标准决策的基础,特别是在充满模糊性和认知犹豫的环境中。Kullback–Leibler(KL)散度不足以捕捉循环直觉模糊(CIF)集合
陈廷宇
台湾桃园市龟山区文华一街259号长庚大学管理学院工业与商业管理系,邮编33302
**摘要**
在不确定性评估中量化差异是多标准决策的基础,特别是在充满模糊性和认知犹豫的环境中。Kullback–Leibler(KL)散度不足以捕捉循环直觉模糊(CIF)集合的结构复杂性。为了解决这一限制,本研究提出了一种基于CIF信息的KL散度度量方法,该方法结合了基于半径的几何信息和稳定性常数以提高数值鲁棒性,同时保持了KL的核心属性和CIF公理。通过使用全局极端基准,开发了两种基于散度的指标——评估指标和重要性指标,用于标准化评估。这些指标被嵌入到基于平均解决方案距离(EDAS)框架的评估系统中,实现了客观权重分配、参考基准比较以及正负散度指标的聚合。该算法为在不确定性下对替代方案进行排序提供了一种计算效率高的方法。通过一个涉及选择人工智能增强型临床决策支持系统提供商的实际案例,并辅以敏感性和比较分析,证明了其适用性。
**1. 引言**
循环直觉模糊(CIF)结构在Atanassov的经典直觉模糊(IF)集合的基础上,通过嵌入圆形几何结构来同时表示成员关系、犹豫程度和非成员关系,这种结构基于半径进行表示[1]。这种圆形表述增强了不确定性建模的表达能力,特别适用于定义不清和高风险的决策场景[2]、[3]。在传统的IF框架中,每个元素都由成员关系(m)和非成员关系(n)程度表示,受到0≤m+n≤1的线性约束。尽管这种基于点的结构在数学上方便,但它可能限制了表示人类判断中的复杂不确定性和变异性的能力[4]。
为了克服这一限制,CIF集合引入了一个圆形许可域,其中每个评估值表示为一个以(m,n)为中心、半径r∈[0,2]的区域。该半径明确地捕捉了直觉组分的分布和几何不确定性,从而实现对模糊性的更灵活和忠实的表示[3]。与经典IF模型相比,CIF集合结合了概率解释(通过成员关系、非成员关系和犹豫程度)和几何不确定性(通过径向分布),为建模复杂的决策环境提供了更丰富的表达框架[4]、[5]。与IF和其他模糊扩展相比,CIF通过半径组分引入了额外的几何自由度,使得对不确定性分布和异质性的建模更加有效[4]。
模糊决策方面的最新进展进一步凸显了这种丰富表示的必要性。例如,Yin等人[6]开发了一个基于IF的决策框架,用于应急响应策略,展示了IF模型在处理不确定专家评估中的有效性。类似地,Amin等人[7]提出了一种区间值球形模糊测量和根据妥协解决方案排名(MARCOS)方法,用于职业路径优化,强调了高级模糊结构在群体决策情境中的重要性。此外,Liaqat等人[8]引入了一个模糊不平衡Prodeg指数,用于多标准决策,表明了对新型基于模糊的评估机制的日益兴趣。
在这些发展的基础上,最近的研究越来越多地探索CIF及相关框架,以更好地捕捉多维不确定性。例如,Shahin等人[9]提出了一个结合区间不确定性和圆形犹豫程度的区间值CIF MARCOS模型。Khan等人[10]证明CIF集合通过加入径向程度,使得通过Dombi基运算符进行更可靠的聚合成为可能。最近的贡献进一步扩展了基于CIF的决策建模,包括高级聚合和混合MCDM框架[11]、基于相似性的评估机制[12],以及在IVCIF环境下的实际风险评估应用[13]。同时,CIF距离和相似性度量的最新方法论发展——如基于余弦的距离公式[14]——强调了准确量化圆形模糊环境中差异的必要性。这些研究表明,基于CIF的模型在处理不确定性方面提供了更高的灵活性和表达能力。然而,它们主要强调聚合、相似性或基于距离的评估,而本研究则提出了一种基于散度的、信息论驱动的框架,能够同时捕捉信息差异和几何不确定性。
尽管取得了这些进展,但仍存在两个关键差距。首先,大多数现有方法主要依赖于距离或相似性度量,并侧重于聚合、排名或评分机制,从信息论的角度对基于散度的评估关注有限。其次,CIF表示与原则性散度度量(特别是Kullback–Leibler(KL)散度的整合尚未系统地探索。特别是,目前还缺乏能够同时捕捉CIF环境中的信息差异和几何不确定性的统一框架。
受到这些差距的启发,本研究在CIF环境中开发了一个基于KL散度的评估框架。通过将信息论散度与圆形模糊表示相结合,所提出的方法实现了一种更加细致、可解释且能意识到不确定性的决策机制,特别适合于复杂的多标准问题,如人工智能(AI)增强的临床决策支持系统(CDSS)提供商的选择。
**1.1. CIF背景下KL散度公式的紧迫需求**
KL散度,也称为相对熵,是信息论的基石,用于量化两个概率分布之间的差异[15]。与对称距离度量不同,KL散度本质上是不对称的,它捕捉了真实分布与其近似值之间的对数差异,从而衡量信息损失[16]。这一特性使其在决策科学[17]、深度学习[18]、故障诊断[19]、统计推断[20]等领域以及信号处理、图像分割[21]和不确定性感知决策[22]等应用中不可或缺。
在充满模糊性和不确定性的模糊环境中,KL散度已被广泛扩展以适应模糊集合及其泛化,从而推动了理论和实践的进步。例如,Sharma和Sarswat[23]开发了一种非对称模糊散度度量,并分析了其与KL散度的关系。在优化领域,Zeng等人[24]将KL散度整合到低碳能源规划的分布鲁棒框架中,用于模拟可再生能源生成的概率不确定性。在聚类和学习情境中,Lahmar等人[25]使用KL散度对模糊成员矩阵进行加权,而Li等人[26]将其整合到用于时间数据插补和表示学习的模糊分区架构中。同样,Wang等人[27]利用KL散度将模糊知识规则与潜在概率结构对齐,提高了工业系统的可解释性。
最近的研究进一步展示了KL散度在高级模糊框架中的扩展作用。Aydo?an等人[17]将其应用于可持续电子废物管理的决策支持,使用函数值IF结构;Kumari等人[16]将其整合到医学图像分割的模糊聚类中;Zhou等人[22]利用KL散度进行混合模糊分类器的特征选择;Wei等人[15]探索了其与广义熵度量的联系。应用还扩展到能源系统[28]、图像处理[29]、领域适应[19]和鲁棒优化[31]等领域,共同强调了其在处理不确定性方面的多功能性。
尽管取得了这些进展,但在将KL散度扩展到CIF环境方面仍存在一个关键差距。CIF集合通过将成员关系、犹豫程度和非成员关系结合到一个圆形几何结构中,提供了对不确定性的更丰富的表征[4]、[32]。这种表述保持了直觉组分之间的相互依赖性,并能够更真实地描绘现实世界的模糊性[2]、[5]。然而,现有研究对CIF环境中的KL散度探索有限,且尚未建立与CIF集合的圆形代数和几何属性相一致的系统化公式。这一差距限制了理论进展和在决策分析、聚类及不确定性量化中的实际应用。
解决这一限制需要开发特定于CIF的KL散度度量方法,这些方法应尊重圆形拓扑和直觉平衡。这样的公式将能够更准确地量化分布差异,并提高模糊推理机制的可解释性。因此,将KL散度整合到CIF框架中不仅仅是理论上的扩展,而且是向更富有表达力和现实性的不确定性建模迈出的必要步骤。特别是,引入径向不确定性为传统基于IF的方法提供了无法捕捉的额外几何维度,从而加强了针对CIF环境的散度度量的需求。
**1.2. CIF距离导向评估模型中平均机制的局限性**
在认知不确定性和证据分散的情况下,需要更具区分性的评估,这导致了将CIF理论整合到基于平均解决方案距离(EDAS)框架中。EDAS最初由Keshavarz Ghorabaee等人[33]提出,与传统多标准决策方法不同,它根据备选方案与平均参考值的偏离来评估它们,而不是与理想或反理想解决方案的偏离。与TOPSIS(基于与理想解决方案的相似性排序技术)和VIKOR(多标准优化和妥协解决方案)等方法不同,EDAS使用通过各标准算术平均值计算出的平均备选方案作为数据驱动和分布感知的参考点。这一特点使EDAS特别适合捕捉备选方案的实证分散。增强CIF的EDAS框架进一步扩展了这一能力,适应了现实决策情境中常见的不确定性、犹豫和圆形偏好结构。
Chen[34]和Garg[35]等人的显著贡献开发了适应CIF环境的CIF EDAS框架,引入了专门的运算符(包括圆形聚合方案和定制的去模糊化程序),以定义CIF设置中的正负偏差。Imran和Ullah[36]以及Bahramloo[37]的后续研究进一步验证了CIF EDAS方法在不同领域(如汽车战略和城市洪水易感性分析)中的适用性,证明了其在不确定条件下的鲁棒性。
尽管取得了这些进展,现有的CIF EDAS模型主要依赖于基于距离的度量(如Minkowski度量[34]、代数距离公式[35]和绝对偏差度量[36])来量化与平均解决方案的偏差。虽然这些方法提供了计算上的便利性,但它们并未充分利用信息论构造的优势。特别是,捕捉不对称和分布敏感差异的散度度量在CIF EDAS框架中尚未得到充分探索。鉴于CIF集合的复杂和相互依赖的结构,这种遗漏是一个重要的方法论限制。
这一差距尤为重要,因为像KL散度这样的散度度量提供了更具表达力和理论依据的比较手段。与对称距离度量不同,散度度量考虑了方向差异、分布分散和语义不对称性。这些属性在CIF环境中尤为重要,因为成员关系和非成员关系程度以非线性方式相互作用并表现出耦合的不确定性。
迄今为止,还没有CIF EDAS框架将基于散度的评估纳入其中以替代或补充传统距离度量。这突显了一个重要的研究机会:开发一个基于散度的CIF EDAS框架,其中与平均解决方案的偏差作为主要评估机制。这种方法将增强对微妙偏好差异的敏感性,并提供更具区分性和语义意义的排名过程。此外,尽管CIF EDAS模型采用平均解决方案作为参考点,但其公式通常以常规方式处理,而没有对其在CIF条件下的适用性进行批判性审查。这种缺乏审查削弱了该框架的理论基础,并暴露了另一个研究缺口——需要为CIF环境量身定制的结构一致和语义连贯的平均解决方案定义。
总之,尽管CIF EDAS模型在处理不确定性和犹豫方面代表了重要的进展,但它们对基于距离的度量和简化平均机制的依赖限制了它们的分析深度。因此,结合基于散度的评估并重新审视平均解决方案的作用是开发更健壮和富有表达力的CIF EDAS框架的关键步骤。
**1.3. 在CIF不确定性下基于散度的评估框架的动机**
基于前述文献评估和关键分析,本研究的动机如下:
• 桥接KL散度和CIF逻辑,用于决策制定中的不一致性检测:CIF集合理论为复杂决策中的不确定性建模提供了更富表现力和几何丰富的框架。然而,传统的散度度量(如传统KL散度)缺乏评估CIF环境中差异所需的结构兼容性。鉴于越来越需要检测微妙的不一致性和评估圆形及直觉不确定性下的推理差异,迫切需要既与CIF语义数学一致又在计算上可行的散度度量。本研究通过扩展KL散度以适应CIF表示的三元和径向结构来填补这一空白。
• 解决基于EDAS方法中散度度量被忽视的角色:现有的CIF EDAS模型[34]、[35]、[36]在工业优化和洪水风险分析等领域展示了强大的适用性。然而,它们几乎完全依赖于基于距离的度量(如Minkowski或代数距离)来评估与平均解决方案的偏差。鉴于CIF数据的不对称性和不确定性,散度度量提供了更为理论基础的选择。缺乏基于散度的评估方法限制了方法的表现力,并构成了一个关键的研究空白。因此,本研究旨在开发一个基于散度的EDAS框架,以提高在复杂决策环境中的鲁棒性、可解释性和敏感性。
•重新思考平均解在CIF EDAS框架中的作用:平均解是EDAS的核心,用于评估正偏差和负偏差。然而,在CIF背景下,传统的算术平均无法捕捉CIF数据中固有的圆形几何和非线性关系。CIF表示的径向和方向属性以标准聚合无法保留的方式编码了犹豫和极性。这一限制要求使用与CIF结构一致的聚合机制重新定义平均解,从而提高评估过程的准确性和可解释性。
•解决在选择AI增强的CDSS提供商时的复杂性和不确定性:选择AI增强的CDSS提供商是一个涉及技术、临床和运营因素相互依赖的复杂多标准决策问题。这种复杂性因专家评估中的不确定性和主观性而进一步加剧。算法性能与以人为本的考虑之间的相互作用需要一个超越纯粹定量评估的评估框架。如果没有这样的方法,AI增强型CDSS解决方案的价值可能会被低估或未得到充分采用。
1.4. 研究目标和贡献
现有CIF EDAS模型主要依赖距离度量,忽略了散度测量可以捕捉的细微信息属性。散度量化了CIF结构之间的信息差异,考虑了分布和方向上的差异。当前CIF EDAS框架中缺乏散度测量限制了它们完全表示圆形直觉模糊性的能力。因此,整合散度测量对于增强表示丰富性和分析敏感性至关重要。作为回应,本研究将基于CIF的KL散度及其相关散度驱动指标纳入EDAS结构中,从而为复杂决策分析提供了一个新的评估框架。
当前研究的主要目标是在CIF环境中设计一个基于KL散度的评估框架,用于选择AI增强的CDSS提供商。具体来说,研究旨在:
(1)开发一个针对CIF环境的KL散度公式及其公理属性。
(2)建立具有严格理论基础的KL散度驱动评估和重要性指标。
(3)引入基于散度的指标,以量化多个标准下相对于参考CIF值的正偏差和负偏差。
(4)构建一个结合客观加权、参考值构建和基于散度评估的集成决策模型。
(5)通过利用CIF集的表现力来解决医疗决策中的不确定性和犹豫问题,以有效选择提供商。
本研究对决策科学和模糊逻辑建模做出了以下关键贡献:
•朝着与CIF兼容的散度理论进展:提出了一种新的基于CIF的KL散度度量,将经典KL散度扩展到适用于成员资格、非成员资格、犹豫和径向不确定性的统一熵-几何框架。这种公式保留了可解释性、数学一致性和计算可行性,使其能够应用于排名、不一致性检测和不确定性量化。
•CIF信息的KL散度的数学严谨性、参数灵活性和稳定性:所提出的散度度量满足了非负性、不可区分元素的身份、方向敏感性、关于半径差异的单调性以及在CIF约束下的有界性等基本公理。引入了一个可调参数来控制径向不确定性的影响,而一个稳定常数确保了在存在零值组件的情况下的计算鲁棒性。
•基于KL散度的CIF评估和重要性评估指标:基于极端基准的散度开发了新的指标,这些基准代表了最大确定性和不确定性。这些指标捕捉了信息不对称性和高阶不确定性,在统一尺度内产生标准化输出。它们的有界性、单调性和一致性得到了严格证明。
•在CIF背景下制定基于KL散度的评估框架:提出了一个结构化的七阶段框架,整合了基于散度的加权、参考构建和性能评估。该框架计算正负散度指标,将它们汇总为综合得分,并产生可解释的排名结果。它结合了信息论原则和CIF建模,以支持在不确定性下的稳健决策。
•来自实际应用的实用和方法论贡献:该框架通过应用于AI增强的CDSS提供商选择得到了验证,证明了其在处理不确定和直觉数据方面的有效性。结果显示了稳定、可解释和区分性的排名。全面的敏感性分析进一步揭示了稳定性和响应性之间的权衡,使决策者能够根据风险偏好和不确定性水平调整模型参数。
总体而言,这些贡献确立了所提出的框架作为CIF环境和其他数据不确定环境中的稳健、灵活且具有不确定性意识的复杂决策工具。
1.5. 组织结构
本文的组织结构如下。第2节通过介绍CIF集的基本原理和形式符号来建立概念基础。第3节开发了一个针对CIF环境的KL散度框架,引入了稳定常数以确保数值鲁棒性并满足可靠不一致性检测的关键公理属性。第4节提出了两种基于KL散度的指标,用于根据固定的全局基准评估CIF值评估和重要性水平,随后构建了一个用于多方面决策分析的新散度驱动评估框架。第5节通过一个关于AI增强型CDSS提供商选择的案例研究展示了所提出方法的实际适用性,并通过全面的比较分析进行了支持。最后,第6节总结了研究发现,指出了局限性,并概述了未来研究的方向。
2. CIF集的基础构建和符号公式
本节介绍了CIF集的概念和数学基础,该框架通过结合不确定性的几何表示扩展了传统的IF框架。与将评估表示为固定点的传统IF集不同,CIF集通过圆形区域对不确定性进行建模,从而能够更灵活和表达性地表征模糊性。数学符号及其解释在附录A中提供。
经典的L-模糊集表述为:
(1) L=〈?,?〉?,?∈[0,1] 且 ?+?≤1,
描述了在归一化约束下的成员资格和非成员资格程度的可接受组合。在此基础上,CIF集引入了圆形表示来捕捉不确定性分散。
定义1[1] 设 mC(?) 和 nC(?) 表示有限宇宙X上的成员资格和非成员资格函数,满足 mC?, nC?∈[0,1] 且 mC?+nC?≤1 对于每个 ?∈X。CIF集 C 定义为中心在 (mC?, nC?) 且半径 rC?∈[0,2] 的圆形区域:
(2) 或 (mC?, nC?)=L?〈?,?〉mC?-?2+nC?-?2≤rC?。
因此,CIF集表示为:
(3) C=〈?, mC?, nC?; rC?〉?∈X=〈?, 或 (mC?, nC?)〉?∈X。
圆形区域满足:
(4) 或 (mC?, nC?)=〈?,?〉?,?∈[0,1], mC?-?2+nC?-?2≤rC?, ?+?≤1;
这定义了一个有界的不确定性区域。
每个CIF值元素 cC?=(mC?, nC?; rC?) 因此被表示为一个圆形区域,而不是一个点,捕捉了围绕中心评估的不确定性分散。犹豫程度定义为:
(5) hC?=1-mC?-nC?,
表示残余的不确定性。值得注意的是,当 rC?=0 时,CIF表示退化为经典的IF集,证实了IF是CIF框架的一个特例。图1说明了CIF值元素的几何解释,突出显示了它们与基于点的IF集表示相比的圆形不确定性区域。
定义2[38], [39] 考虑一组CIF值元素 cC(1)?=(mC(1)?, nC(1)?; rC(1)?), cC(2)?=(mC2?, nC2?; rC(2)?), ?, cC(?)?=(mC(?)?, nC(?)?; rC(?)?) 以及权重向量 W=(w1,w2,?,w?)T,其中 ∑ι=1?wι=1。使用可适应的加权平均操作符 A?, ?∈{I,II,III,IV} 获得聚合的CIF值:
(6) AIcC1?, cC2?,?, cC??=1-∏ι=1?1-mCι?wι, ∏ι=1?nCι?wι; maxι=1?rCι?,
(7) AIIcC1?, cC2?,?, cC??=1-∏ι=1?1-mCι?wι, ∏ι=1?nCι?wι; minι=1?rCι?,
(8) AIIIcC1?, cC2?,?, cC??=1-∏ι=1?1-mCι?wι, ∏ι=1?nCι?wι; 1-∏ι=1?1-rCι?wι,
(9) AIVcC1?, cC2?,?, cC??=1-∏ι=1?1-mCι?wι, ∏ι=1?nCι?wι; ∏ι=1?rCι?wι。
下载:下载高分辨率图片(109KB)
下载:下载全尺寸图片
图1. 决策三角形内的CIF元素的几何示意图,展示了圆形区域的适应性灵活性。
具体来说,Khan等人[38]提出的操作符AI、AII和AIII,以及Ullah等人[39]改进的AIII和AIV,提供了系统化的框架,将多个CIF值合成一个统一的表示形式。这些操作符旨在保留每个CIF实例的固有圆形语义,同时通过权重分布W适应不同的重要性。
注释1(解释和操作符选择指南)。尽管聚合机制AI-AIV对于成员资格和非成员资格组件有共同的公式,但它们在合成径向不确定性项rC?的方式上有所不同。这种差异导致在表示集体CIF信息时的行为特征不同。具体来说,操作符AI采用最大径向值,从而保留了聚合CIF元素中的最高不确定性水平。这种机制反映了适用于风险敏感决策环境的保守聚合策略。相比之下,操作符AII采用最小径向值,强调最可信的信息来源,因此代表了更乐观的聚合行为。操作符AIII通过概率联合类型公式 1-∏ι=1?(1-rC?)wι 来聚合径向不确定性,从而捕捉了多个来源贡献的累积不确定性,因此提供了集体不确定性的平衡表示。最后,操作符AIV使用乘法聚合径向值 ∏ι=1?(rC?)wι,强调了贡献CIF评估之间的共识。因此,聚合操作符的选择可以解释为反映了CIF信息融合中不同的不确定性传播态度。在实际决策应用中,操作符的选择可能取决于决策者对不确定性的容忍度、信息来源的可靠性以及所需的共识表示水平。
3. CIF框架中KL散度度的公式化
在受CIF逻辑支配的决策环境中,评估CIF值元素与规范参考标准之间的差异对于捕捉可能影响选项排名或分类的不一致性至关重要。传统的散度度量(如KL散度)提供了量化分布差异的强大工具,但未能适应CIF表示中固有的三元结构和几何细微差别。为了解决这一限制,本节介绍了一种新的散度度量——称为基于CIF的KL散度——它通过嵌入特定于CIF语义的参数扩展了经典KL框架。这种公式使得在不确定的多标准设置中比较CIF值元素变得更加全面和理论一致。这些发展为将KL散度集成到先进的基于CIF的建模和决策分析框架中奠定了基础。
3.1. KL散度的理论基础
KL散度——也称为相对熵[40]或I-散度[20]——是信息论和统计推断[23],[41]中的一个基本概念。它是一种方向性度量,用于衡量两个概率分布(真实(或经验)分布U和近似分布V)之间的差异。具体来说,它量化了使用V近似U时产生的信息效率低下或“信息损失”[15]。与传统距离度量不同,KL散度本质上是不对称的,反映了概率结构和期望[16],[31]之间的差异。
在样本集X上的离散概率空间中,让U(x)和V(x)表示分配给结果x∈X的概率。从U到V的KL散度定义为:
(10) DU‖V=∑xU(x)·log(U(x)V(x)。
这种公式衡量了使用V代替U时预期的信息损失或额外编码成本。散度以nats(自然对数)或bits(以2为底的对数)表示,并且当且仅当U=V时达到其最小值零。尽管通常被称为“距离”,但由于其不对称性(DU‖V≠DV‖U)和违反三角不等式,KL散度不满足度量的属性。相反,它应该被解释为熵差异的方向性度量。
KL散度具有几个支撑其适用性的关键属性:
(1) 非负性(信息不等式):DU‖V≥0,当且仅当U=V时相等,如Gibbs不等式所暗示的。
(2) 在等价性下一为零:当两个分布几乎处处相同时,散度消失。
(3) 方向性(不对称性):该度量本质上是方向性的,区分了真实分布及其近似。
(4) 推理效率的度量:它量化了使用近似模型而不是真实分布时所需的额外信息。
(5) 对分布差异的敏感性:KL散度特别敏感于低概率区域的差异,能够检测到微妙的结构偏差。
这些属性使得KL散度成为评估分布差异、模型保真度和统计和决策背景下的信息损失的严格且可解释的工具。
3.2. 基于CIF的KL散度的构建和显著特性
在涉及CIF框架的多方面决策场景中,一个基本挑战在于量化分配给候选选项的评估表达式与其相应参考值(即表示参考的最高和最低限制的全球极端基准)之间的一致性程度。这样的不一致性度量对于区分不同标准下的相对性能至关重要。鉴于这一方法论需求,本小节提出了一种基于CIF的KL散度,通过将两个关键元素纳入经典KL结构中来适应CIF环境的独特语义。
在正式介绍散度度量之前,明确指导所提出公式设计的原则是重要的。CIF信息的KL散度的构建遵循了由CIF表示的混合概率-几何性质产生的三个基本考虑。首先,组件mC?, nC?和hC?=1-mC?-nC?共同形成了一个满足单纯形约束 mC?+nC?+hC?=1 的标准化三元组。这种结构允许三元组 (mC?, nC?, hC?) 被解释为关于肯定、否定和犹豫状态的准概率分布。因此,经典信息论的散度度量——特别是KL散度——为量化两个CIF评估之间的信息差异提供了一种自然的机制。所提出的度量的熵分量通过作用于三元组(mC?,nC?,hC?)将KL散度扩展到了CIF领域。其次,与传统IF集不同,CIF表示包含了额外的几何属性,即径向不确定性rC?,它反映了成员关系非成员关系平面内圆形不确定性区域的分散程度。由于这个量不表示概率质量,而是一个几何量,直接将其纳入对数KL结构会违反散度背后的概率解释。为了保留信息和几何语义,散度被构建为一个混合加法度量,结合了熵散度分量和几何差异项。第三,径向差异通过绝对差|rCi?-rCj?|来建模。这种线性惩罚反映了rC?作为类似距离的不确定性量的解释:径向分散的差异直接对应于两个CIF元素之间不确定性扩散的差异。线性惩罚确保了径向差异的贡献与不确定性扩散的分离成比例增长,从而保持了直观的可解释性,并避免了可能主导熵分量的非线性放大效应。因此,所提出的CIF信息KL散度可以被视为一种混合散度,它同时捕捉了CIF表示中的信息不一致性和几何不确定性分离。正式定义如下。
定义3 设cC(i)?=(mC(i)?,nC(i)?;rC(i)?)和cC(j)?=(mC(j)?,nC(j)?;rC(j)?)是任意两个CIF值元素,其相关的犹豫度定义为hC(i)?=1-mCi?-nC(i)?和hC(j)?=1-mCj?-nC(j)?。从cC(i)?到cC(j)?的CIF信息KL散度,记为Dλ(cC(i)?‖cC(j)?),定义为:
(11) Dλ(cC(i)?‖cC(j)?=1/2[mC(i)?·log(mC(i)?+ε)mC(j)?+ε+nC(i)?·log(nC(i)?+ε)nC(j)?+ε+hC(i)?·log(hC(i)?+ε+hC(j)?+ε+λ·(rCi?-rCj?),其中ε∈R+是一个小的正常化常数,用于防止对数项中的计算奇异性——特别是由零值分量引起的奇异性——λ∈[0,1]是一个可调的权重系数,用于调节半径散度的影响,从而控制其在整个散度度量中的相对重要性。
这种表述将CIF三元组视为一个准概率分布,从而使得KL散度范式适应CIF上下文。前三项基于CIF元素的分解结构捕捉了相对熵散度——反映了肯定、否定和不确定性的程度——而最后一项引入了基于半径的惩罚,用于量化两个元素之间不确定性扩散的差异。常数ε纯粹作为一个数值正则化因子,用于防止对数项中的计算奇异性,并不携带决策论的意义。因为相同的ε均匀应用于所有评估的CIF元素,其对散度比较的影响可以忽略不计,并且不影响备选的相对排名。实际上,可以采用任何足够小的正常数(例如10^-8)而不改变散度度量的定性行为。此外,对数底数的选择只会在KL型散度度量中引入一个常数缩放因子。因此,改变对数底数不会影响散度值的相对排序或结果的决策排名。为了清晰性和与常见信息论表述的一致性,本研究采用了自然对数而没有失去通用性。
参数λ在平衡所提出的散度度量的信息和几何分量方面起着关键作用。具体来说,它调节了半径差异项|rCi?-rCj?|的相对贡献,该项捕捉了CIF集合的圆形表示内不确定性扩散的差异。从决策论的角度来看,λ可以解释为一个控制参数,反映了决策者对不确定性扩散的敏感度。较小的λ值更重视来自准概率三元组(mC?,nC?,hC?)的熵散度,从而优先考虑肯定、否定和犹豫程度的差异。相反,较大的λ值增加了几何半径差异的影响,强调CIF评估之间不确定性扩散的大小差异。在实际决策环境中,λ的选择可能取决于决策者对不确定性的态度。优先考虑信息一致性的决策环境可能采用相对较小的λ值,而认为不确定性扩散至关重要的环境可能采用较大的λ值。因此,λ提供了一种灵活的机制,用于适应不同的不确定性态度和决策偏好。
值得注意的是,当λ=0时,散度退化为纯熵形式;当λ>0时,它结合了概率和几何散度特征。尽管λ∈[0,1]在数学上是有效的,但本研究建议采用更严格的操作范围λ∈(0,1]。这一限制背后的理由在于CIF集合的几何独特性,其主要特征是包含了径向距离分量rC?。将λ设为0有效地消除了这一径向项的影响,从而将散度度量简化为忽略CIF集合的一个基本属性的形式。这种简化削弱了使用CIF框架的理论和实践动机,CIF框架旨在通过肯定和否定程度以及径向扩散表现出的犹豫来封装不确定性。通过确保λ>0,所提出的散度度量保留了径向距离在量化CIF值元素之间差异中的综合作用,从而保持了对CIF理论核心原则的忠实度。
CIF信息KL散度度量在CIF框架内的适用性的关键特征和理论依据包括以下几点:
(1) 全面表示:所提出的散度将CIF集合的所有四个核心组成部分——成员关系、非成员关系、犹豫和径向不确定性——封装在一个统一且数学上连贯的框架内。
(2) 符合CIF公理:该公式保留了CIF模型的基本约束,包括有界求和条件mC?+nC?+hC?=1和圆形域结构。
(3) 经典逻辑的扩展:通过将KL散度推广到模糊结构,该模型提供了对复杂不确定性表示的经典信息论原则的直观和模块化扩展。
(4) 可调节的敏感性:参数λ允许根据上下文进行敏感调整,允许在需要不同强调模糊性(例如,成员关系模糊性)与不确定性大小(例如,半径)的应用中具有更大的灵活性。
(5) 可解释的输出:较高的散度值反映了元素之间的更大不一致性,使其适用于在基于CIF的决策程序中进行排名、不一致性检测或模型拟合任务。
CIF信息KL散度作为一个理论上有根据且在实践中可适应的度量,用于捕捉CIF环境中的不一致性和散度,从而促进了在不确定性下的多方面决策分析中的更细致分析。以下八个定理建立了所提出度量的关键公理属性和扩展特性。它们的详细证明在附录B的(B.1)–(B.8)中提供。
定理1(不可区分物的身份)。对于cC(i)?=(mC(i)?,nC(i)?;rC(i)?)和cC(j)?=(mC(j)?,nC(j)?;rC(j)?),当且仅当cC(i)?=cC(j)?时,CIF信息KL散度Dλ(cC(i)?‖cC(j)?)=0。
定理2(非负性)。对于任意两个CIF值元素cC(i)?和cC(j)?,CIF信息KL散度满足Dλ(cC(i)?‖cC(j)?)≥0。
定理3(不对称性和方向敏感性)。CIF信息KL散度本质上是不对称的和方向敏感的;也就是说,通常有Dλ(cC(i)?‖cC(j)?)≠Dλ(cC(j)?‖cC(i)?)。
定理4(独立组件的可加性)。设H∈mC?,nC?,hC?,其中组件mC?,nC?,hC?∈[0,1],并满足归一化条件mC(i)?+nC(i)?+hC(i)?=1,cC(j)?也是如此。那么,CIF信息KL散度Dλ(cC(i)?‖cC(j)?)在这些独立组件上是可加的。
定理5(在ε正则化下的稳定性)。对于任何足够小的ε>0,CIF信息KL散度Dλ(cC(i)?‖cC(j)?)保持连续性和数值稳定性,有效避免了由零值分量引起的奇异性。
定理6(连续性)。如果cC(j)?→cC(i)?,那么Dλ(cC(i)?‖cC(j)?)→0。
定理7(在CIF约束下的有界性)。在mC?+nC?≤1的条件下,CIF信息KL散度的上限由依赖于ε和CIF域限制的有限常数确定。具体来说,
(12) Dλ(cC(i)?‖cC(j)?≤3/2*log(1+ε)^ε+2·λ。
定理8(关于半径差的单调性)。CIF信息KL散度Dλ(cC(i)?‖cC(j)?)随着绝对差|rCi?-rCj?|的增加而单调增加。
总之,CIF信息KL散度提供了一种严格构建且语义对齐的方法,用于量化CIF值元素之间的方向性不一致性。通过整合经典KL散度的概率可解释性和CIF集合的结构独特性——特别是通过包含径向距离项和ε正则化的对数分量——所提出的度量以统一的方式捕捉了熵和几何差异。这里建立的公理属性证实了其数学上的稳健性,包括恒等性、非负性、连续性和有界性,同时突出了方向敏感性和分量可加性等关键特征。这些特征共同增强了散度度的解释能力和操作适应性,使其适用于在复杂不确定性下的各种决策应用。将λ作为一个可调参数的纳入进一步允许从业者在信息偏差和径向不确定性之间平衡重点,增强了模型的灵活性和对CIF语义的忠实度。
3.3. 替代公式讨论
理论上可以构建CIF散度度量的其他形式。例如,可以通过二次惩罚(如(rCi?-rCj?)2)来结合径向差异,与熵分量进行乘法耦合,或者使用类似于KL结构的对数变换。然而,这些公式存在几个限制。二次惩罚倾向于不成比例地放大大的径向偏差,并可能在高不确定性设置中破坏散度值。熵分量和径向分量之间的乘法耦合可能导致解释上的模糊性,因为几何不确定性项会扭曲KL散度的概率意义。同样,将rC?嵌入对数比率中缺乏理论依据,因为rC?不满足类似于概率分布的归一化约束。
相比之下,本研究中采用的加法混合结构提供了一个平衡且可解释的公式。熵分量捕捉了准概率CIF三元组(mC?,nC?,hC?)内的信息差异,而线性径向惩罚量化了不确定性扩散的几何散度。权重参数λ作为一个耦合系数,调节了几何不确定性在整个散度度量中的相对贡献。这种结构保持了信息和几何差异之间的概念分离,同时允许它们在统一的散度框架内集成。
除了信息论视角之外,所提出的散度度量还在CIF集合的圆形表示中允许几何解释。在CIF框架中,每个CIF值元素cC?=(mC?,nC?;rC?)可以被视为嵌入在成员关系非成员关系平面中的圆形不确定性区域。对(mC?,nC?)对指定了圆的 center,而rC?表示围绕该中心评估的不确定性扩散的半径。这种几何表示通过明确建模不确定性的扩散来区分CIF集合和经典IF集合,而不是将评估表示为单一的确定性点。在比较两个CIF值元素cC(i)?和cC(j)?时,会出现两种不同的差异形式。第一种涉及由三元组(mC?,nC?,hC?)确定的中点的信息配置,这反映了肯定、否定和犹豫的差异。这种差异自然通过熵KL散度分量捕捉。第二种涉及不确定性区域的空间范围的差异,由半径rC(i)?和rC(j)?控制。
从几何角度来看,绝对半径差|rCi?-rCj?|量化了两个CIF圆之间的不确定性扩散的分离。较大的差异表明即使它们的中心评估相同,两个评估也表现出显著不同的不确定性扩散水平。因此,引入基于半径的差异项使得散度度量能够捕捉到不仅是信息不一致性,还有不确定性大小的主观差异。线性惩罚|rCi?-rCj?|提供了这种几何分离的直接且可解释的度量。因为半径在CIF圆形空间中充当类似距离的量,线性惩罚保持了散度贡献与不确定性扩散之间的比例关系。这种设计确保了几何分量与熵散度项的兼容性,同时避免了可能扭曲信息差异相对重要性的过度非线性放大。
总之,所提出的CIF信息KL散度可以解释为一种混合散度,它同时捕捉了信息差异和不确定性扩散的几何差异。熵分量将经典KL散度扩展到了CIF评估的准概率结构,而线性半径惩罚反映了CIF空间中不确定性区域之间的几何分离。通过保持信息和几何分量之间的明确概念区别,所采用的加法结构确保了理论上的可解释性和计算稳定性。因此,所提出的公式为量化具有复杂不确定性的决策环境中的CIF值元素之间的差异提供了一种原则性和灵活的机制。
注2(半径惩罚的几何一致性)。使用线性半径差异项λ|rCi?-rCj?|在几何上与CIF集合的圆形表示是一致的。由于参数rC?表征了围绕中心(mC?,nC?)的不确定性扩散的大小,半径的差异直接对应于相关不确定性区域的空间范围的差异。将半径差异视为类似距离的量,确保了几何因素对发散度的贡献与不确定性范围的分离成正比增加,从而保持了可解释性和与熵发散分量的兼容性。4. 在CIF设置下基于KL散度的评估方法基于基于KL散度的评估和重要性度量的基本概念,本节介绍了一种新的评估框架,该框架与EDAS模型的核心原则保持一致。所提出的方法通过使用基于KL散度的指标来量化候选方案相对于中心参考结构的有利和不利的偏差,从而提供了一种平衡的、基于统计的、语义丰富的排名方法。该框架包括几个集成阶段。首先,使用基于KL散度的重要性度量来推导标准化标准权重,以捕捉决策信息中的变异性。接下来,使用可适应的聚合操作符为每个标准构建一个中心参考CIF值,作为基准。然后利用KL散度生成偏差指标,以区分与这个参考的有利和不利的偏差,从而实现细致的性能评估。最后,通过根据EDAS逻辑结合正面和负面散度测量及其标准化值来获得聚合的评估分数。总体而言,所提出的框架在评估复杂和不确定的决策环境中的替代方案时提高了可解释性和稳健性。4.1. 面向CIF的群体决策配置本小节描述了CIF框架内的群体决策环境配置,并解释了所提模型中使用的评估数据的构建方式。在复杂的决策问题中,评估性判断通常通过包含歧义和不确定性的定性语言评估来表达。为了捕捉这些特征,采用了CIF框架,因为它使用三个组成部分来表示评估信息——成员资格、非成员资格和径向不确定性参数——从而更全面地表示决策者的感知。群体决策问题是通过在CIF领域内结合替代方案评估和标准重要性来制定的。设A={a1,a2,?,aζ}表示候选方案集,B={b1,b2,?,bξ}表示评估标准集,其中ζ,ξ≥2。标准集B被划分为旨在最大化的收益导向标准B+和旨在最小化的成本导向标准B-。一个由f1,f2,?,fo组成的决策者小组(o≥2)对替代方案的性能和标准的重要性提供评估性判断。在本研究中,评估数据来自决策者提供的语言评估。每个决策者使用图2中所示的九点语言量表来评估替代方案ai在标准bj下的表现以及标准bj的重要性。这些定性评估随后根据预定义的语义映射转换为IF数值对。下载:下载高分辨率图片(407KB)下载:下载全尺寸图片图2. 用于替代方案评估和标准重要性的定性评估量表及其关联的IF表示。为了聚合个别判断并构建CIF表示,采用了两阶段预处理程序。首先,使用几何平均值聚合决策者提供的IF值来确定集体评估的质心。接下来,通过测量个别IF判断与聚合质心之间的分散来计算径向不确定性参数。采用最大分散值作为CIF表示的半径,确保得到的CIF值保守地反映了群体评估中存在的不确定性。上述预处理程序在定义4中正式定义。定义4. 从图2中描绘的九点语言量表出发,考虑IF对(mijk,nijk)和(ujk,vjk),它们分别表达了决策者fk对替代方案ai相对于标准bj的主观评估以及bj的感知显著性,其中i=1,2,?,ζ, j=1,2,?,ξ, k=1,2,?,o。为了将这些个别观点整合成一个统一的表示,使用几何聚合方法得到替代方案ai在标准bj下的CIF值评估cij,以及分配给标准bj的CIF值重要性?j。获得这些中心坐标和相关径向组件的确切计算步骤在以下公式中详细说明:(13)cij=(mij,nij;rij)=∏k=1omijko,∏k=1onijko;maxk=1omij-mijk2+nij-nijk2,(14)?j=(uj,vj;rj)=∏k=1oujko,∏k=1ovjko;maxk=1ouj-ujk2+vj-vjk2。4.2. KL散度驱动的评估和重要性度量的制定本小节制定了KL散度驱动的评估和重要性度量,并检查了它们的关键属性。为了支持这一制定,引入了两个固定的参考标准——称为全局极端基准。这些基准定义了CIF值空间的理论界限,并一致应用于所有标准,确保了计算效率和概念一致性。上限基准(1,0;0)代表完全的成员资格、零非成员资格和没有更高阶的不确定性,对应于最确定的评估状态。相反,下限基准(0,1;2)代表零成员资格、完全的非成员资格和最大的不确定性,定义了CIF框架内最不确定的状态。这两个基准为评估CIF值元素提供了对称且与标准无关的参考点。通过利用这些全局极端基准,所提出的基于CIF的KL散度度量Dλ一致地量化了与固定、与标准无关的参考点的偏差,不受上下文偏好或特定领域性能目标的影响。这种方法加强了方法上的严谨性,同时与CIF表示的基础几何结构保持一致。以下定义介绍了KL散度驱动的评估和重要性度量,它们分别量化了CIF值评估cij和CIF值重要性?j相对于两个全局极端基准(即最大确定性参考点(1,0;0)及其最大不确定性对应点(0,1;2)的相对评估和重要性位置。定义5. 为了量化CIF值评估cij和CIF值重要性?j与两个全局极端基准(最确定的参考点(1,0;0)和最不确定的参考点(0,1;2)的相对对齐,定义了KL散度驱动的评估度量Mλ(cij)和KL散度驱动的重要性度量Mλ(?j),如下所示:(15)Mλ(cij)=Dλ(0,1;2)‖cij-Dλ(1,0;0)‖cij+Dλ(0,1;2)‖cij,(16)Mλ(?j)=Dλ(0,1;2)‖?j-Dλ(1,0;0)‖?j+Dλ(0,1;2)‖?j。定理9(KL散度驱动度量的运算计算)。设cij=(mij,nij;rij)表示一个CIF值评估,?j=(uj,vj;rj)表示一个CIF值重要性。KL散度驱动的评估度量Mλ(cij)和KL散度驱动的重要性度量Mλ(?j)使用以下公式计算:(17)Mλ(cij)=log1+εnij+ε+2λ·2-rijlog1+εmij+ε+log1+εnij+ε+2λ·2,(18)Mλ(?j)=log1+εvj+ε+2λ·2-rjlog1+εuj+ε+log1+εvj+ε+2λ·2。这里,ε>0是一个稳定常数,λ≥0控制对径向不确定性的敏感度。详细证明见附录B中的(B.9)。分子捕捉了与最大不确定性基准的偏差,而分母使用两个极端参考值对度量进行标准化,确保值在[0,1]范围内。较大的值表示与最确定状态的更接近,反映了更强的评估一致性和较低的不确定性。这种公式将信息不对称性和几何不确定性整合到了一个统一的度量中。度量Mλ(cij)和Mλ(?j)产生的标准化分数在单位区间[0,1]内,其中较大的值表示更接近上限基准。以下定理总结了它们的关键属性。定理10(评估度量的属性)。设cij=(mij,nij;rij)是一个CIF值评估。KL散度驱动的评估度量Mλ(cij)满足以下属性:(T10.1) 有界性:Mλ(cij)∈[0,1]。 (T10.2) 极端一致性:Mλ((1,0;0))=1且Mλ((0,1;2))=0。(T10.3) 单调性:(i) Mλ(cij)相对于mij是增加的;(ii) Mλ(cij)相对于nij是减少的;(iii) Mλ(cij)相对于rij是减少的。证明详见附录B中的(B.10)。定理11(重要性度量的属性)。设?j=(uj,vj;rj)表示一个CIF值重要性。KL散度驱动的重要性度量Mλ(?j)满足以下属性:(T11.1) 有界性:Mλ(?j)∈[0,1]。 (T11.2) 单调性:(i) Mλ(?j)随着uj的增加而增加;(ii) Mλ(?j)相对于vj的减少;(iii) Mλ(?j)相对于rj的减少。证明与定理10类似。具体来说,证明涉及计算度量Mλ(?j)关于每个组件uj、vj和rj的偏导数,利用基于KL散度的表达式的结构形式及其对对数项和线性项的单调行为。这些结果表明,KL散度可以有效地整合到CIF框架中,产生标准化、可解释且对不确定性敏感的评估度量。这种整合不仅增强了基于CIF的决策分析的稳健性,还拓宽了其在由不确定性、不确定性和异质标准特征的复杂决策环境中的应用范围。4.3. 在CIF背景下开发基于KL散度的评估方法本小节开发了一个全面的评估框架,该框架将KL散度理论与CIF环境结合用于多标准决策。该框架首先使用基于KL散度的重要性度量推导标准化标准权重,然后通过可适应的加权聚合构建中心参考CIF值。随后,为个别CIF值评估和参考基准计算评估指标,形成定义正面和负面偏差指标的基础。然后,这些指标被聚合和标准化,以捕捉每个替代方案的有利和不利偏差。最后,评估评分机制将这些组件整合到一个统一的排名方案中,能够在复杂决策环境中识别出最合适的折中方案。• 第1阶段:基于KL散度的标准化权重确定方法本研究采用基于KL散度的重要性度量概念来计算表示为明确数值的重要性权重。回想一下,?j=(uj,vj;rj)表示与标准bj∈B={b1,b2,?,bξ}相关的CIF值重要性。为了以对肯定成分和认识论不确定性都敏感的方式量化每个标准的相对重要性,制定了KL散度驱动的重要性度量Mλ(?j),如方程(16)所定义,并在方程(18)中实现。为了在整个标准集B中得到一个可解释且可比较的权重分布,计算出的Mλ(?j)值被标准化,以得到一个清晰的权重向量Wλ=(Wλ(b1),Wλ(b2),?,Wλ(bξ))T,其中每个标准bj∈B的权重使用以下表达式确定:(19)Wλ(bj)=Mλ(?j)∑j′=1ξMλ(?j′)。该公式满足0≤Wλ(bj)≤1和∑j=1ξWλ(bj)=1的条件。标准化过程确保了得到的权重构成一个有效的概率分布,从而能够一致地整合到后续的决策过程中。为了清晰和简洁,在整个分析过程中当λ固定时,符号Wλ(bj)可以简化为Wj,而不损失一般性。• 第2阶段:用于构建中心参考CIF值的自适应加权聚合在传统的EDAS基础上,平均解作为评估替代方案正面和负面偏差的统计基准。虽然这种构建在经典数值设置中适用,但在CIF环境中则不够充分。与传统的表示不同,CIF集不仅包括[0,1]内的肯定和否定程度,还包括[0,2]内的径向不确定性成分,形成一个圆形且方向敏感的结构。传统的算术平均值不考虑这种几何形状,无法保持CIF表示的角度和径向语义,可能会损害可解释性和语义保真度。因此,在CIF背景下定义平均解存在独特挑战,因为CIF数据的径向和三角形几何形状。CIF集需要能够捕捉其多维特性的聚合机制。然而,现有的CIF EDAS方法通常依赖于传统的平均技术,忽略了这些圆形属性,从而削弱了平均解的概念作用。这种限制突出了需要结构上一致且语义对齐的聚合方法,这些方法明确考虑了CIF值评估中的径向分散和方向信息。为了克服这一限制,提出了一种中心参考CIF值作为传统平均解的替代方案。这种重新表述在理论上和方法论上都是合理的。从理论上讲,它保留了CIF表示的内在几何特性,包括角度方向性和径向分散。从方法论上讲,它允许使用特定于CIF的聚合操作符(例如,定义2中的AI-AIV),这些操作符旨在处理CIF信息的非线性和多维性质。“中心参考”一词反映了其作为中心趋势和参考基准的双重角色。因此,这种替代增强了CIF-EDAS框架的几何连贯性、语义保真性和评估稳健性。本研究基于所有ζ×ξ个CIF值评估cij=(mij,nij;rij)来确定中心参考CIF值,其中ai∈A且bj∈B。具体来说,本研究采用定义2中介绍的可适应加权平均机制在CIF框架内计算中心参考CIF值。鉴于所有候选替代方案a1,a2,?,aζ都被视为非主导的,在聚合过程中赋予每个替代方案相同的权重在实践上是可行的,也是理论上合理的。因此,相应的加权向量W=(w1,w2,?,w?)T被定义为均匀分布,其中wi=1/ζ对于所有i=1,2,?,ζ。在这种等重要性假设下,可以使用可适应的加权平均操作符A?系统地推导出中心参考CIF值cj?=(mj,nj;rj?),对于?∈{I,II,III,IV},如下所述:(20)cjI=AI(c1j,c2j,?,cζj)=1-∏i=1ζ1-mij1ζ,∏i=1ζnij1ζ;maxi=1ζrij,(21)cjII=AII(c1j,c2j,?,cζj)=1-∏i=1ζ1-mij1ζ,∏i=1ζnij1ζ;mini=1ζrij,(22)cjIII=AIII(c1j,c2j,?,cζj)=1-∏i=1ζ1-mij1ζ,∏i=1ζnij1ζ;1-∏i=1ζ1-rij1ζ,(23)cjIV=AIV(c1j,c2j,?,cζj)=1-∏i=1ζ1-mij1ζ,∏i=1ζnij1ζ;∏i=1ζrij1ζ。在所提出的框架中,采用了Khan等人[38]和Ullah等人[39]开发的四种聚合操作符AI-AIV。如备注1中所述,这些运算符主要在处理径向不确定性分量rij的方式上有所不同,同时保持了针对成员和非成员成分的一致聚合机制。为了澄清运算符的行为特征,表1总结了它们的结构属性和不确定性传播机制。尽管这些运算符在聚合成员和非成员成分时使用相同的公式,但它们在合成径向不确定性分量rij的方法上存在差异,这导致在CIF评估的聚合过程中具有不同的解释含义。
表1. CIF适应性加权聚合运算符的行为比较
| 运算符 | 径向聚合规则 | 行为解释 | 不确定性态度 | 适合的决策情境 |
|-----------------|--------------------------------------|----------------------------------|-------------------------------------------|
| AMaxi=1ζrij | 保持输入中最大的径向不确定性 | 保守/风险规避 | 不应低估不确定性的情境 |
| AIImini=1ζrij | 保留最小的径向不确定性 | 以信心为导向/乐观 | 强调最可靠信息来源的情境 |
| AIII=1-∏i=1ζ1-rij | 通过概率并集聚合不确定性 | 平衡的不确定性积累 | 涉及多个不确定来源的决策问题 |
| AIV=∏i=1ζrij | 径向不确定性的乘法共识 | 以共识为驱动 | 强调一致的群体决策 |
从决策理论的角度来看,适应性加权聚合运算符的选择反映了在合成CIF信息时对不确定性传播的不同态度。使用运算符AI和AII获得的中心参考CIF值cjI和cjII代表了两种极端的聚合策略,分别通过保持最大和最小的径向不确定性来体现保守和乐观的聚合行为。相比之下,使用运算符AIII和AIV获得的中心参考CIF值cjIII和cjIV提供了中间机制,通过概率积累或乘法共识来结合多个来源的集体影响。因此,方程式(20)至(23)中的四种公式能够有效地捕捉CIF值评估中嵌入的细微的径向、角度和犹豫特征,从而保持聚合过程的结构和语义完整性。总之,适应性加权聚合运算符的选择可由决策者的风险偏好、信息来源的可靠性以及对集体不确定性的期望解释来指导。在实际应用中,考虑多种运算符也可以作为鲁棒性检查,以评估在不同CIF信息融合机制下排名结果的稳定性。
### 第3阶段:CIF值评估和中心参考估计的评估指标公式化
在本研究中,使用方程式(17)来确定每个CIF值评估cij的KL散度驱动评估指标Mλ(cij)。考虑使用适应性加权平均运算符A?得到的中心参考CIF值cj?=(mj,nj;rj?),其中θ∈{I,II,III,IV}。下面详细介绍了针对每个标准bj计算KL散度驱动评估指标Mλ(cj?)的过程:
\[Mλ(cj?) = \log\left(\frac{1 + \epsilon_{mj} + \epsilon_{nje}}{1 + \epsilon + 2\lambda \cdot \sqrt{2 - r_j\theta}\right)\]
通过比较Mλ(cij)和Mλ(cj?),所提出的KL散度驱动模型系统地识别了每个选项相对于参考标准的有利和不利偏差。这种比较使得能够细致地评估选项,不仅捕捉到与参考点的接近程度,还捕捉到CIF值数据中固有的信息不确定性、径向分散和犹豫特征。
### 第4阶段:用于正向和负向CIF偏差的KL散度诱导指标
在提出的框架内,确定最合适的折中方案是基于对中心参考CIF基准的有利和不利偏差的分析。这个基准是使用KL散度驱动评估指标来建立的,从而能够在可取和不理想的偏差之间进行结构化区分。在定义指标之前,首先使用方程式(11)计算从中心参考值cj?到评估cij的CIF信息驱动的KL散度,其中犹豫程度hj=1-mj-nj和hij=1-mij-nij:
\[D_{\lambda}(c_j\theta \parallel c_j) = \frac{1}{2}\left[m_j \cdot \log(m_j + \epsilon_{mij} + \epsilon_{nje} + \epsilon_{nje} + \epsilon + h_j \cdot \log(h_j + \epsilon_{hij} + \epsilon + \lambda \cdot r_j\theta - r_j\right]\]
第一个指标称为KL散度诱导的正向指标P?λ(cij),它量化了给定选项ai相对于特定标准bj从中心参考CIF值cj?展示的有利偏差程度。该指标是基于选项的KL散度驱动评估指标Mλ(cij)与中心参考点Mλ(cj?)之间的比较来计算的。具体来说,指标定义为:
\[P_{\theta\lambda}(c_j) = \begin{cases}
D_{\lambda}(c_j \parallel c_j) \geq M_{\lambda}(c_j\theta) & \text{如果 } bj \in B_{+} \quad (\text{以收益为导向}), \\
D_{\lambda}(c_j \parallel c_j) \leq M_{\lambda}(c_j\theta) & \text{如果 } bj \in B_{-} \quad (\text{以成本为导向})
\end{cases}\]
其中,指示函数I[·]在指定条件成立时返回1;否则,返回0,从而在公式中充当二进制决策机制。
对于以收益为导向的标准bj∈B+,如果评估指标Mλ(cij)高于参考值,则表明性能优良,相应的偏差D_{\lambda}(c_j \parallel c_j)被视为有利的,并在计算中被保留。相反,对于以成本为导向的标准bj∈B-,如果评估指标Mλ(cij)低于参考值,则表明性能较差,相应的偏差被保留。在所有其他情况下,如果偏差被认为对可行性不利或不相关,则将其设置为零。基于这一逻辑,正向指标P?λ(cij)在评估每个选项的相对价值时起着关键作用,它通过捕捉与理论信息基准相比的有利偏差来支持更加细致、一致和语义丰富的决策。
第二个指标称为KL散度诱导的负向指标N?λ(cij),它量化了给定选项ai在特定标准bj下从中心参考CIF值cj?展示的不利偏差程度。它反映了相对于参考标准的不理想性能偏差。具体来说,负向指标N?λ(cij)的定义如下:
\[N_{\theta\lambda}(c_j) = \begin{cases}
D_{\lambda}(c_j \parallel c_j) \geq M_{\lambda}(c_j\theta) & \text{如果 } bj \in B_{+} \quad (\text{以收益为导向}), \\
D_{\lambda}(c_j \parallel c_j) \leq M_{\lambda}(c_j\theta) & \text{如果 } bj \in B_{-} \quad (\text{以成本为导向})
\end{cases}\]
对于以收益为导向的标准bj∈B+,如果评估指标Mλ(cij)低于参考值Mλ(cj?),则表示性能较差。在这种情况下,偏差D_{\lambda}(c_j \parallel c_j)被视为有利的,并在计算N?λ(cij)时被保留。相反,如果选项的表现优于或等于参考值,则不予惩罚,偏差被设置为零。对于以成本为导向的标准bj∈B-,逻辑相反。如果评估指标Mλ(cij)高于参考值,则表明性能较差,相应的偏差被视为不利的,并在计算中予以保留。
### 备注3(KL散度诱导指标的关键属性)
KL散度诱导的正向指标P?λ(cij)和负向指标N?λ(cij)具有几个重要的属性,这些属性增强了在CIF环境下的评估框架的可解释性和一致性:
1. **非负性**:这两个指标本质上是非负的,因为它们是基于KL散度定义的,而KL散度本身是一个非负的度量。
2. **选择性激活**:每个指标根据CIF值评估cij与中心参考CIF值cj?之间的关系以及相应标准bj∈B+∪B-的语义方向条件性地被激活,确保只保留具有上下文意义的偏差。
3. **对无关偏差的零赋值**:如果评估cij展示的偏差方向与期望的偏好结构相矛盾(例如,对于收益导向的标准来说是一个较低的值),则相应的指标被设置为零,以避免误导性的评估。
4. **语义一致性**:正向指标P?λ(cij)捕捉到相对于参考基准表现优越的偏差,而负向指标N?λ(cij)量化了相对于同一基准表现较差的偏差。
5. **比较一致性**:这两个指标使用相同的参考CIF值cj?,确保所有选项都根据理论基础的标准进行一致评估,从而促进了选项和标准之间的公平和语义一致的比较。
### 第5阶段:候选选项评估的聚合散度分数
在提出的KL散度驱动评估框架内,引入了两个聚合指标来评估每个选项相对于所有标准从中心参考基准的总体优点和缺点。设Wλ(bj)表示标准bj的标准化权重,其中0≤Wλ(bj)≤1且∑j=1ξWλ(bj)=1。设P?λ(cij)表示相对于中心参考值cj?的CIF值评估cij的KL散度诱导正向指标。通过将权重Wλ(bj)与正向指标P?λ(cij)相结合,可以得出选项ai的聚合正向散度分数SP?λ(ai):
\[SP_{\theta\lambda}(ai) = \sum_{j=1}^{n} \xi W_{\lambda}(b_j) \cdot P_{\theta\lambda}(c_j)\]
该分数捕捉了选项ai相对于参考基准的整体有利偏差,权重由标准的重要性决定。较高的值表示在正向偏差方面的整体优越性更强。
类似地,KL散度诱导的负向指标N?λ(cij)可以使用权重Wλ(bj)来聚合,以捕捉选项ai相对于中心参考CIF值在标准bj下的不利偏差。因此,聚合负向散度分数SN?λ(ai)的定义如下:
\[SN_{\theta\lambda}(ai) = \sum_{j=1}^{n} \xi W_{\lambda}(b_j) \cdot N_{\theta\lambda}(c_j)\]
该分数反映了ai在所有标准下展示的不利偏差的累积程度。较低的分数表示较少的比较劣势和与中心基准的一致性提高。
### 备注4(聚合散度分数的关键属性)
聚合正向散度分数SP?λ(ai)和聚合负向散度分数SN?λ(ai)具有以下基本属性:
1. **有界性**:由于KL散度D_{\lambda}(c_j \parallel c_j)≥0且权重向量Wλ被标准化为0≤Wλ(bj)≤1且∑j=1ξWλ(bj)=1,因此SP?λ(ai)和SN?λ(ai)都被保证是非负的并且下界为零;即:SP?λ(ai)≥0和SN?λ(ai)≥0。
2. **解释双重性**:这两个度量作为互补的评估构造:(i) SP?λ(ai)捕捉并奖励有利偏差——表明性能超过中心参考标准;(ii) SN?λ(ai)识别并惩罚不利偏差——表明性能低于参考基准。这种双重结构使得在基于CIF的评估框架下能够平衡和语义上连贯地解释每个选项的相对地位。
3. **上下文敏感性评估**:每个术语P?λ(cij)或N?λ(cij)的计算取决于相应标准bj∈B+∪B-的方向,确保偏差评估与决策上下文的方向一致。
4. **区分能力**:这些分数通过分离有利和不利偏差,使得在多方面的设置中对选项进行更精确和可解释的排序。
### 第6阶段:用于选项比较的标准化散度分数
为了 facilitating scale-invariant comparisons and maintaining consistency across diverse evaluation contexts,引入了两个标准化指标:标准化正向散度分数和标准化负向散度分数。
标准化正向散度分数,表示为NSP?λ(ai),将其相对于所有选项中的最大值进行缩放:
\[NSP_{\theta\lambda}(ai) = \frac{SP_{\theta\lambda}(ai)}{\max_{i} NSP_{\theta\lambda}(ai')}\]
标准化负向散度分数,表示为NSN?λ(ai),通过反向缩放聚合负向散度分数来反映更低的惩罚作为更可取的表现。其定义为:
\[NSN_{\theta\lambda}(ai) = \frac{SN_{\theta\lambda}(ai')}{\min_{i} NSN_{\theta\lambda}(ai')}\]
### 备注5(标准化散度分数的关键属性)
标准化正向散度分数NSP?λ(ai)和标准化负向散度分数NSN?λ(ai)具有以下理想属性:
1. **范围有界性**:这两个标准化分数都被限制在区间[0,1]内,较高的值表示更理想的结果。具体来说:0≤NSP?λ(ai)≤1和0≤NSN?λ(ai)≤1。
2. **规范化一致性**:这些指标对散度值进行规范化,使得在不同选项之间进行无偏见的比较,同时不扭曲潜在的偏好结构。
3. **解释对齐**:(i) NSP?λ(ai)强调选项相对于参考标准表现优越的程度;(ii) NSN?λ(ai)突出选项避免较差表现的程度,为具有较低负向偏差的选项分配更高的分数。
这些标准化分数作为构建复合评估或最终排名指标的基础组件,在更广泛的KL散度驱动的CIF决策框架中发挥作用。
### 第7阶段:优先选项排名的聚合评估分数
为了综合标准化评估并支持全面的决策,引入了聚合评估分数AS?,φλ(ai):
\[AS_{\theta,\phi(\lambda)(ai) = \phi \cdot NSP_{\theta\lambda}(ai) + (1-\phi) \cdot NSN_{\theta\lambda}(ai)\]
其中φ∈[0,1]表示正向强调系数,用于平衡整体评估过程中正面强化和负面缓解的权重。聚合评估分数整合了标准化正向散度分数NSP?λ(ai),它反映了选项超出参考标准的正向偏差程度,以及标准化负向散度分数SN?λ(ai),它捕捉了不利偏差的最小化程度。整合通过一个标量φ∈[0,1]进行调节,称为正向强调系数,它允许决策者调整在促进优秀表现与惩罚较差结果之间的相对重要性。一旦为所有选项ai∈A={a1,a2,?,aζ}计算出AS?,φλ(ai)分数,就根据这些分数进行降序排序。表现出最高AS?,φλ(ai)的选项被视为最合适的折中结果,有效地在CIF框架内平衡了有利属性和劣势的缓解。
### 4.4. 提出的算法概述
提出的KL散度驱动评估方法在CIF环境下分为七个阶段的过程。它从基于散度诱导显著性指标推导标准化标准权重开始(第1阶段),然后使用适应性加权平均运算符构建中心参考CIF值(第2阶段)。这些数值作为评估基于CIF值的替代方案评估的基准(第三阶段)。随后,基于KL散度的指标被制定出来,以量化与参考基准的正负偏差(第四阶段)。然后使用标准化权重对这些指标进行汇总,以获得每个替代方案的整体优势和劣势得分(第五阶段)。这些得分进一步被标准化,以确保可比性并反映相对性能差异(第六阶段)。最后,引入了一个正强调系数,将标准化得分整合到一个统一的评估指标中,用于对替代方案进行排名(第七阶段)。总体而言,该框架提供了一个稳健且考虑敏感性的评估机制,该机制结合了参考一致性、基于散度的区分以及复杂决策环境中的偏好平衡。图3展示了所提出的基于KL散度的CIF评估框架的工作流程,用于群体多标准决策。该过程从配置决策问题并将专家判断转换为CIF表示开始。然后应用基于KL散度的计算来推导重要性指标和评估指标,从而能够平衡地评估与中心参考值的正负偏差。通过包括汇总、标准化和最终评分在内的顺序步骤,该框架产生了可解释且具有统计依据的替代方案排名。如图3所示,每个阶段都建立在前一个阶段的基础上,确保了整个评估过程的一致性和清晰性。
具体来说,所提出的基于KL散度的评估机制在CIF环境中通过一个算法化流程实现,该流程分为若干模块化部分——即输入规范、参数初始化和CIF导向配置、核心EDAS程序步骤以及输出生成。
输入模块:输入规范
- 制定一个结构化的群体决策范式,其中包括一组决策者F=f1,f2,?,fo、一系列候选替代方案A={a1,a2,?,aζ}以及一组评估标准B={b1,b2,?,bξ},这些标准被划分为收益导向(B+)和成本导向(B-)两个子集。
- 选择合适的CIF语言尺度方案(例如,图2中所示的九点尺度)。建议采用奇数点的尺度,如七点或九点,以包含中立立场并提高测量敏感性。
初始化模块:参数初始化和CIF导向配置
- 选择KL散度指标的对数基数——可以是自然对数(以nats为单位)或二进制对数(以bits为单位);根据需要也可以使用其他基数。
- 为稳定性常数ε和在KL散度指标中使用的可调参数λ指定合适的数值。建议为重要性和评估指标使用统一的ε和λ值,以简化计算过程。
- 收集每个决策者对标准bj的替代方案ai的评估,以及他们对bj感知重要性的评估,使用预定义的定性尺度。将这些评估转换为if对(mijk,nijk),用于替代方案评估(cij)和标准重要性(ujk,vjk)。
- 调用几何聚合方法来综合群体判断,从而产生对应于ai在bj下的CIF值评估cij和分配给bj的CIF值重要性?j,如公式(13)和(14)中正式规定的。
步骤模块:核心EDAS程序步骤
步骤1:给定ε和λ的指定值,使用公式(16)或等效的公式(18)计算每个CIF值重要性?j的KL散度驱动的重要性指标Mλ(?j)。
步骤2:使用计算出的重要性指标Mλ(?j)根据公式(19)得出每个标准bj∈B的标准化清晰权重Wλ(bj)。所得权重构成向量Wλ=(Wλ(b1),Wλ(b2),?,Wλ(bξ))T,作为每个标准重要性的定量表示。
步骤3:选择适当的适应性加权平均运算符A?,其中?∈{I,II,III,IV},以构建参考值。使用公式(20)至(23)计算每个标准bj对应的中心参考CIF值cj?=mj,nj;rj?。
步骤4:保持ε和λ的指定值,并按照公式(24)计算每个中心参考CIF值cj?的KL散度驱动评估指标Mλ(cj?)。
步骤5:使用预先确定的ε和λ值,根据公式(15)或等效的公式(17)计算每个CIF值评估cij的KL散度驱动评估指标Mλ(cij)。
步骤6:保持ε和λ的选定值,并使用公式(25)计算从cj?(带有犹豫程度hj)到cij(带有犹豫程度hij)的CIF信息KL散度。
步骤7:生成指标函数IMλ(cij)≥Mλ(cj?)和IMλ(cij)≤Mλ(cj?),分别对应于bj∈B+和bj∈B-。随后,使用公式(26)计算每个cij的KL散度驱动的正指标P?λ(cij)。
步骤8:构建指标函数IMλ(cij)≤Mλ(cj?)和IMλ(cij)≥Mλ(cj?),分别对应于bj∈B+和bj∈B-。然后,使用公式(27)计算每个cij的KL散度驱动的负指标N?λ(cij)。
步骤9:综合计算出的标准权重Wλ(bj)以得出聚合的正偏差得分SP?λ(ai)和聚合的负偏差得分SN?λ(ai),如公式(28)和(29)中定义。
步骤10:使用公式(30)和(31)分别对所有替代方案的偏差得分进行标准化,以获得标准化的正偏差得分NSP?λ(ai)和标准化的负偏差得分NSN?λ(ai)。
步骤11:指定正强调系数φ的值,以平衡整体评估过程中正面强化和负面缓解的影响。然后,根据公式(32)计算每个ai的聚合评估得分AS?,φλ(ai)。
输出模块:输出生成
步骤12:根据计算出的评估得分AS?,φλ(ai)按降序对所有替代方案ai∈A进行排名,从而确定得分最高的方案为最合适的折中解决方案。
第1至7阶段的程序实施具体通过以下步骤映射实现:第1-7阶段分别对应于步骤1-2、步骤3、步骤4-5、步骤6-8、步骤9、步骤10和步骤11-12。
所提出的基于KL散度的评估框架具有低计算复杂性,其复杂度与决策矩阵的大小线性相关。对于一个包含o位专家、ζ个替代方案和ξ个标准的决策设置,主要操作(包括CIF聚合、KL散度计算和正/负偏差指标的构建)仅需要O(o+1ζξ)的时间。最终的排名步骤增加了轻微的O(ζlogζ)开销。内存使用同样高效,为O(ζξ),因为算法只存储CIF评估的决策矩阵和一小部分辅助向量。总体而言,该框架在评估数量方面具有线性时间复杂度,计算负担轻,可扩展到大型决策环境,并适用于涉及高维CIF基础的现实世界应用。这种计算特性使得所提出的方法能够应用于具有大量替代方案、标准和决策者的决策问题,而不会产生显著的计算负担。
5. 在选择AI增强的CDSS提供商中的应用
为了证明所提出的基于KL散度的评估框架在CIF环境中的实际相关性和方法论韧性,提供了一个现实世界的应用场景。该案例基于台湾一家领先的三级转诊医院(以下简称案例医院),该医院以其先进的医疗设施和数字化转型举措而闻名。决策问题和数据集来自Chen [2],涉及三位领域专家对三个候选提供商进行评估,评估标准共九项。图4展示了AI增强型CDSS提供商评估背景下的评估标准概念概述。
每个标准都使用基于CIF的语言尺度进行评估,以捕捉来自临床、技术和行政方面的专家判断。在标准中,b3和b6是成本导向的,而其他七个是收益导向的。这些标准共同为选择确保临床有效性、可扩展性和法规合规性的AI增强型CDSS平台提供了全面的基础。
5.1. 方法论的实施
在输入模块之后,建立了一个结构化的群体决策框架,包括三名决策者F=f1,f2,f3、三个替代方案A={a1,a2,a3}(供应商Alpha、Beta和Gamma)以及九个标准B={b1,b2,?,b9},这些标准被划分为收益导向的标准B+={b1,b2,b4,b5,b7,b8,b9}和成本导向的标准B-={b3,b6}。采用了图2中所示的九点CIF语言尺度。
在初始化模块中,使用自然对数的基于CIF的KL散度来计算评估和重要性指标。稳定性常数和调整参数分别设置为ε=10^-8和λ=0.5。
每位决策者提供对替代方案和标准的语言评估,这些评估被转换为if对(mijk,nijk)和(ujk,vjk),如表2中所总结的。然后使用几何平均值对这些评估进行汇总,以获得CIF值评估cij和CIF值权重?j,如公式(13)–(14)中所定义的。
表2. 决策者对替代方案和标准的评估及if转换。
空白单元格
a1的语义评分和if对(m1jk,n1jk)
a2的语义评分和if对(m2jk,n2jk)
b1
HV: (0.70, 0.25)
AAV: (0.60, 0.35)
AV: (0.50, 0.45)
CHV: (0.90, 0.10)
VHV: (0.80, 0.15)
CHV: (0.90, 0.10)
b2
CHV: (0.90, 0.10)
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
CHV: (0.90, 0.10)
VHV: (0.80, 0.15)
b3
AAV: (0.60, 0.35)
AV: (0.50, 0.45)
AV: (0.50, 0.45)
CHV: (0.90, 0.10)
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
b4
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
CHV: (0.90, 0.10)
AAV: (0.60, 0.35)
AV: (0.50, 0.45)
AV: (0.60, 0.35)
b5
HV: (0.70, 0.25)
HV: (0.70, 0.25)
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
HV: (0.70, 0.25)
AAV: (0.60, 0.35)
b6
HV: (0.70, 0.25)
AAV: (0.60, 0.35)
AAV: (0.60, 0.35)
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
b7
VHV: (0.80, 0.15)
CHV: (0.90, 0.10)
CHV: (0.90, 0.10)
VHV: (0.80, 0.15)
HV: (0.70, 0.25)
VHV: (0.80, 0.15)
b8
VHV: (0.80, 0.15)
CHV: (0.90, 0.10)
HV: (0.70, 0.25)
VHV: (0.80, 0.15)
CHV: (0.90, 0.10)
HV: (0.70, 0.25)
b9
AAV: (0.60, 0.35)
AV: (0.50, 0.45)
UAV: (0.40, 0.55)
HV: (0.70, 0.25)
VHV: (0.80, 0.15)
HV: (0.70, 0.25)
语义评分和if对(m3jk,n3jk) for a3
语义评分和if对(ujk,vjk) for bj∈B
空白单元格
f1f2f3f1f2f3
b1
HV: (0.70, 0.25)
VHV: (0.80, 0.15)
CHV: (0.90, 0.10)
VHI: (0.80, 0.15)
VHI: (0.80, 0.15)
CHI: (0.90, 0.10)
b2
HV: (0.70, 0.25)
AAV: (0.60, 0.35)
HV: (0.70, 0.25)
VHI: (0.80, 0.15)
HI: (0.70, 0.25)
VHI: (0.80, 0.15)
b3
AAV: (0.60, 0.35)
HV: (0.70, 0.25)
HV: (0.70, 0.25)
AI: (0.50, 0.45)
HI: (0.70, 0.25)
AAI: (0.60, 0.35)
b4
AV: (0.50, 0.45)
AAV: (0.60, 0.35)
HV: (0.70, 0.25)
HI: (0.70, 0.25)
AAI: (0.60, 0.35)
b5
VHV: (0.80, 0.15)
HV: (0.70, 0.25)
VHV: (0.80, 0.15)
VHI: (0.80, 0.15)
HI: (0.70, 0.25)
HI: (0.70, 0.25)
b6
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
VHI: (0.80, 0.15)
AAI: (0.60, 0.35)
b7
VHV: (0.70, 0.25)
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
VHI: (0.80, 0.15)
VHI: (0.80, 0.15)
b8
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
VHV: (0.80, 0.15)
CHI: (0.90, 0.10)
CHI: (0.90, 0.10)
VHI: (0.80, 0.15)
b9
AAV: (0.60, 0.35)
AV: (0.50, 0.45)
AV: (0.50, 0.45)
AAI: (0.60, 0.35)
AAI: (0.60, 0.35)
HI: (0.70, 0.25)
作为一个示例,考虑c19,它代表在标准b9下对替代方案a1的评估。根据表2,三位决策者的if评估分别为(0.60, 0.35), (0.50, 0.45), 和 (0.40, 0.55)。应用几何聚合得到:
c19=0.6·0.5·0.43,0.35·0.45·0.553;max0.6·0.5·0.43-0.62+0.35·0.45·0.553-0.352,0.6·0.5·0.43-0.52+0.35·0.45·0.553-0.452,0.6·0.5·0.43-0.42+0.35·0.45·0.553-0.552=(0.4932,0.4425;0.1423)。cij和?j的聚合结果如表3所示。
表3. 聚合的CIF值评估和标准重要性值。
bjc1j=(m1j,n1j;r1j)
c2j=(m2j,n2j;r2j)
c3j=(m3j,n3j;r3j)
?j=(uj,vj;rj)
b1(0.5944, 0.3402; 0.1448)
(0.8653, 0.1145; 0.0744)
(0.7958, 0.基于四种可适应的加权平均方案计算出的中心参考CIF值。bjI=(mj,nj;rjI)cjII=(mj,nj;rjII)cjIII=(mj,nj;rjIII)cjIV=(mj,nj;rjIV)b1(0.7766, 0.1822; 0.1448)(0.7766, 0.1822; 0.0744)(0.7766, 0.1822; 0.1185)(0.7766, 0.1822; 0.1132)b2(0.7885, 0.1687; 0.0957)(0.7885, 0.1687; 0.0747)(0.7885, 0.1687; 0.0818)(0.7885, 0.1687; 0.0811)b3(0.7023, 0.2475; 0.0957)(0.7023, 0.2475; 0.0747)(0.7023, 0.2475; 0.0881)(0.7023, 0.2475; 0.0875)b4(0.6904, 0.2569; 0.1448)(0.6904, 0.2569; 0.0747)(0.6904, 0.2569; 0.1053)(0.6904, 0.2569; 0.1008)b5(0.7323, 0.2068; 0.1486)(0.7323, 0.2068; 0.0914)(0.7323, 0.2068; 0.1128)(0.7323, 0.2068; 0.1097)b6(0.7414, 0.2028; 0.0972)(0.7414, 0.2028; 0.0000)(0.7414, 0.2028; 0.0644)(0.7414, 0.2028; 0.0000)b7(0.8049, 0.1535; 0.0972)(0.8049, 0.1535; 0.0744)(0.8049, 0.1535; 0.0897)(0.8049, 0.1535; 0.0889)b8(0.7972, 0.1536; 0.1347)(0.7972, 0.1536; 0.0000)(0.7972, 0.1536; 0.0919)(0.7972, 0.1536; 0.0000)b9(0.6007, 0.3380; 0.1423)(0.6007, 0.3380; 0.0914)(0.6007, 0.3380; 0.1095)(0.6007, 0.3380; 0.1069)根据第4步并保留指定的ε和λ值,使用方程(24)计算了与中心参考CIF值cj?相关的KL散度驱动评估指标M0.5(cj?),其中?∈{I,II,III,IV}。根据第5步,然后使用方程(17)推导出所有CIF值评估cij的相应指标M0.5(cij)。这些计算过程与计算M0.5(?j)的过程类似。M0.5(cj?)和M0.5(cij)的完整结果分别显示在表5中。进一步比较M0.5(cij)和M0.5(cj?)有助于识别相对于参考基准的不同ai的有利和不利差异,无论是基于收益导向的标准(bj∈B+)还是成本导向的标准(bj∈B-)。表5. 计算出的KL散度驱动评估指标。空单元格cj?的评估指标cij的评估指标bjM0.5(cjI)M0.5(cjII)M0.5(cjIII)M0.5(cjIV)M0.5(c1j)M0.5(c2j)M0.5(c3j)b10.88200.90290.88980.89130.77930.94120.8964b20.90290.90900.90690.92880.92880.8373b30.85810.86470.86050.86060.75210.92880.8373b40.83610.85840.84870.85010.92880.77420.7793b50.86060.87790.87150.87240.87710.84100.8930b60.88020.90960.89010.93690.8930b70.91030.91690.91250.91270.94120.89300.8930b80.89720.93550.90930.93550.89640.89640.9369b90.78330.80020.79420.79510.71080.87710.7521如第6步所述,使用指定的ε=10-8和λ=0.5值,使用方程(25)计算了从每个中心参考CIF值cj?(犹豫度hj=1-mj-nj)到每个CIF值评估cij(犹豫度hij=1-mij-nij)的CIF信息KL散度。例如,给定c1IV=0.7766,0.1822;0.1132(h1=0.0412)和c21=(0.8653,0.1145;0.0744)(h21=0.0202),CIF信息KL散度D0.5(c1IV‖c21)的计算如下:D0.5c1IV‖c21=120.7766·ln0.7766+10-80.8653+10-8+0.1822·ln0.1822+10-80.1145+10-8+0.0412·ln0.0412+10-80.0202+10-8+0.5·0.1132-0.0744=0.0344。D0.5(cj?‖cij)的完整结果显示在表6中。表6. 相对于中心参考CIF基准的计算KL散度。空单元格D0.5(cj?‖c1j)的结果D0.5(cj?‖c2j)的结果D0.5(cj?‖c3j)的结果bj?=I?=II?=III?=IV?=I?=II?=III?=IV?=I?=II?=III?=IVb10.03740.07260.05060.05320.05020.01500.03710.03440.00660.03170.00960.0123b20.01380.00330.00680.00650.01380.00680.00650.01900.02950.02600.0263b30.03310.04170.03500.03530.03740.02690.03360.03330.00160.01210.00540.0057b40.06650.03140.04670.04450.04290.02800.02320.02090.00990.04500.02970.0319b50.02870.00010.01080.00920.00170.03030.01960.02110.02720.00440.00930.0078b60.01770.06200.02980.06200.0540.00540.03760.00540.00100.04960.01740.0496b70.01980.00840.01610.01570.00250.01390.00630.00670.00250.01390.0067b80.00000.06740.02140.06740.00000.06740.06740.00000.04600.0000b90.01220.03770.02860.02990.04790.02250.03150.03020.03030.00730.01390.0126根据第7步,分别确定了bj∈B+和bj∈B-的指示函数IM0.5(cij)≥M0.5(cj?)和IM0.5(cij)≤M0.5(cj?)。基于这些,使用方程(26)计算了KL散度诱导的正指标P?0.5(cij)。考虑PI0.5(c11), PI0.5(c12)和PI0.5(c13)(其中?=I,i=1),b1和b2是收益导向的,b3是成本导向的。根据表5中的KL散度驱动评估指标M0.5(cjI)和M0.5(c1j),指示函数的值分别为0、1和1,因为M0.5c11响应是稳定且可预测的,表明在λ谱系中表现最佳的替代方案的加权行为是一致的。替代方案a2也呈现出平滑且渐进的轨迹,从0.0044开始上升到0.0124。这种增长比在AII下更为明显,表明a2的差异结构被AIII的加权逻辑更有效地激活了,尤其是在λ的中等范围内(例如,λ=0.4到0.8)。替代方案a3表现出非线性的增长模式,在较低的λ值(λ=0.0005到0.0082)时增长较为平缓,然后在较高的λ值(λ=0.6时为0.0097,到λ=1时为0.0193)时增长迅速。这表明AIII在超过某个阈值后放大了差异效应,反映了半径成分日益增强的主导性。图5(c)突出了敏感性分析中的关键比较见解:
• 中等敏感性曲线:在AIII下的得分始终高于AII,但通常低于AI,表明其聚合行为较为均衡,避免了极端加权。
• a3的适应性响应:在较高λ值时增长率的提高突显了AIII捕捉初始差异较低替代方案中由半径驱动的细微变化的能力。
• 稳定性和一致性:所有替代方案都表现出单调且平滑的趋势,与AII下观察到的不规则模式形成对比,证实了AIII的内部稳定性。
• 提高的区分能力:随着λ的增加,三种替代方案之间的差距稳步扩大,这意味着AIII随着对半径重视程度的提高增强了正向差异度量的区分能力。
图5(d)显示了随着λ的增加,所有三种替代方案的聚合正向差异得分总体呈单调增长。这表明AIV的融合逻辑在保持早期方案总体进展的同时,引入了适度的非线性并增强了响应性,尤其是对于排名较低的替代方案。具体来说:
• 替代方案a1在所有λ值下始终获得最高的差异得分,从λ=0.0092增加到λ=1时的0.0276。这种增长平稳且稳定,与AI非常相似,尽管增长幅度略小。这表明AIV在保持替代方案间结构平衡的同时,保持了强烈的λ敏感性。
• 替代方案a2表现出渐进且比例合理的增长,得分从0.0044增加到0.0114。一致的增量表明其加权方案能够适度放大差异而不会出现突然的变化,其轨迹介于AII和AIII之间,反映了中等到高的响应性。
• 替代方案a3显示出两阶段模式:在较低的范围(λ=0-0.3)内增长最小(在λ=0.2时达到0.0015),然后在λ=0.3到0.8之间迅速增长(从0.0052增加到0.0127)。在λ=0.9时略有下降(从0.0127降至0.0118),但在λ=1时恢复到0.0131。这种波动可能表明AIV内部存在动态的加权交互作用。
图5(d)提供了从敏感性分析中得出的几个比较见解:
• 平衡的聚合行为:在四种机制中,AIV在AI的线性、AII的平坦不敏感性和AIII的细腻响应性之间提供了良好的平衡。
• a3的局部敏感性:在λ=0.9时的轻微异常表明其对半径差异的细微变化具有更高的敏感性,尤其是对于排名较低的替代方案。
• 提高的区分能力:三种替代方案之间的得分差异随着λ的增加而持续增大,特别是在λ=0.5到1.0的范围内,这意味着AIV在后期λ阶段增强了区分能力和分辨率。
总体而言,在所有四种机制中,随着λ的增加,聚合正向差异得分SP?λ(ai)呈现出一致的上升趋势。这证实了半径差异在塑造评估结果中的重要作用,尤其是在较高λ范围内。相对排名模式在不同配置下保持一致——最初是SPIλa1>SPIλa2>SPIλ(a3),而在较高λ值下变为SPIλa1>SPIλa3>SPIλ(a2)。值得注意的是,替代方案a1在差异驱动的评估中表现出稳定且近乎线性的增长,强化了其主导性和稳健性。从方法论的角度来看,AI和AIII更适合强调差异放大的场景,而AIV在不确定或波动性条件下提供了平衡且稳定的响应。相比之下,在希望最小化对半径差异敏感性的风险规避情境中,AII更为合适。
此外,本研究采用了基于CIF的KL差异公式,并使用了以2为底的对数。基于这种log2变体的SP?λ(ai)的相应敏感性分析在附录C(图C.1)中提供。
图6展示了在不同实验场景下,三种替代方案的聚合负差异得分SN?λ(ai)的情况,以及四种可适应加权平均机制下的结果,分别如图6(a)–(d)所示。基于log2变体的敏感性分析在附录C(图C.2)中提供。
在可适应加权平均机制AI下,图6(a)展示了三种替代方案在11个逐渐增加的λ值下的聚合负差异得分SNIλ(ai)。一个清晰的差异模式显现出来:
• 替代方案a1保持了几乎恒定的负差异得分,从0.0058开始,仅略微下降到0.0057。这种稳定性表明,在AI方案下,a1在负差异方面的表现对λ的变化相对不敏感。
• 替代方案a2显示出明显的上升趋势,得分从0.0054增加到0.0237。这表明随着λ的增加,其负差异程度逐渐增加,意味着在这种加权配置下a2的劣势逐渐加大。
• 替代方案a3表现出适度的增长,从0.0043增加到0.0094。虽然增长幅度不如a2,但上升趋势仍然表明差异在逐渐积累,与中心参考值的差异逐渐增大。
总体而言,结果显示出一种权衡动态:虽然a1保持了稳定且较低的负差异,但随着λ的增加,a2和a3都经历了差异惩罚的增加。这突显了a1在AI机制下的稳健性,表明其相对于聚合严格性的上升具有相对的韧性。
图6(b)展示了使用AII平均机制在11个逐渐增加的λ值下,三种替代方案的聚合负差异得分SNIIλ(ai)。可以观察到以下模式:
• 替代方案a1显示出一致且陡峭的增长,得分从0.0058增加到0.0351。这表明随着聚合变得越来越严格,a1的负差异显著增加,表明其与中心参考值之间的差异越来越大。
• 替代方案a2也稳定增长,从0.0054增加到0.0328,尽管增幅略低于a1。这反映了其对λ的适度敏感性,随着聚合权重的增加差异也在累积。
• 替代方案a3显示出不太平稳的模式。虽然其得分总体上从0.0043增加到0.0243,但在λ=0.3时暂时下降(从0.0089降至0.0080),之后再次上升。这种非单调行为可能表明该替代方案在AII下的特定权重调整中存在变异性。
图6(c)展示了在AIII机制下,随着λ参数增加,三种替代方案的聚合负差异得分SNIIIλ(ai)的演变。观察到的模式如下:
• 替代方案a1展现出稳定且线性的增长,得分从0.0058增加到0.0172。这种一致的增长表明随着聚合变得更加严格,a1与中心参考值的差异逐渐增大,尽管增长速度相对于之前的机制较为温和。
• 替代方案a2遵循类似但更陡峭的上升趋势,从0.0054增加到0.0250。这表明其对λ的敏感性更高,随着聚合强度的增加,其与a1的差异差距也在扩大。
• 替代方案a3表现出非线性和不太规则的模式。其得分从0.0043增加到0.0114,然后在λ=0.7时下降到0.0100,之后再次上升到0.0126。这种暂时下降表明在AIII下存在局部稳定效应,表明其与加权结构的互动更为不稳定。
图6(d)展示了在AIV机制下,替代方案a1、a2和a3的聚合负差异得分SNIVλ(ai)的演变。结果表明:
(1) 替代方案a1显示出平稳且一致的增长,从0.0058增加到0.0289,表明随着λ的增加,差异持续放大。
(2) 替代方案a2遵循几乎相同的上升轨迹,从0.0054增加到0.0288。在较高λ值下的紧密收敛表明差异行为相似,尽管在早期阶段的值略低于a1,表明差异略有减少。
(3) 替代方案a3表现出非单调的模式。其得分从0.0043增加到0.0081,然后在λ=0.4时下降到0.0067,之后再次上升到0.0156。这种波动可能表明由于与中间权重结构的对齐,差异效应暂时得到缓解。
总之,所有替代方案都随着λ的增加而表现出增强的负差异。其中,a1的增长最为明显,而a3显示出较为平缓但不太规则的轨迹,表明其相对韧性与不稳定的敏感性并存。
图6(c)展示了在AIII机制下,随着λ参数的增加,三种替代方案的聚合负差异得分SNIIIλ(ai)的演变。观察到的模式如下:
• 替代方案a1表现出稳定且线性的增长,得分从0.0058增加到0.0172,表明随着聚合变得越来越严格,其与中心参考值的差异逐渐增大,尽管增长速度相对于之前的机制较为温和。
• 替代方案a2遵循类似的但更陡峭的上升趋势,从0.0054增加到0.0250。这表明其对λ的敏感性更高,随着聚合强度的增加,其与a1的差异差距也在扩大。
• 替代方案a3显示出非线性和不太规则的模式。其得分从0.0043增加到0.0114,然后在λ=0.7时下降到0.0100,之后再次上升到0.0126。这种暂时下降表明在AIII下存在局部稳定效应,表明其与加权结构的互动更为不稳定。
图6(d)展示了在AIV机制下,替代方案a1、a2和a3的聚合负差异得分SNIVλ(ai)的演变。结果表明:
(1) 替代方案a1显示出平稳且一致的增长,从0.0058增加到0.0289,表明随着λ的增加,差异持续放大。
(2) 替代方案a2遵循几乎相同的轨迹,从0.0054增加到0.0288。在较高λ值下的紧密收敛表明差异行为相似,尽管在早期阶段的值略低,表明差异相对减少。
(3) 替代方案a3表现出非单调的模式。其得分从0.0043增加到0.0081,然后在λ=0.4时下降到0.0067,之后再次上升到0.0156。这种波动可能表明由于与中间权重结构的对齐,差异效应暂时得到缓解。
总之,a1和a2在AIV下显示出几乎相同且强烈的线性差异模式,而a3总体上差异较小,但表现出局部不稳定性。因此,AIV在顶级替代方案之间提供了有限的区别,同时更清晰地区分了a3。在所有四种机制中,随着λ从0增加到1,聚合负差异得分SN?λ(ai)总体上都在增加,表明随着对基于半径的成分的重视增加,差异效应变得更加明显。在稳定性与敏感性之间的权衡方面,AI提供了高稳定性,但可能低估了差异,从而掩盖了替代方案之间的差异。相比之下,AII和AIV表现出更高的敏感性,但在增加波动性的同时增强了区分能力。AIII机制则提供了一个平衡的折中方案,能够在保持稳定 progress 的同时实现有意义的区分。
总体而言,比较综合揭示了不同的行为特征:
(i) AI强调稳健性和一致性;
(ii) AII和AIV增强了敏感性和排名对比;
(iii) AIII在可解释性和稳定性之间取得了平衡。因此,决策者可以根据分析优先级选择最合适的机制——无论是优先考虑稳健性、敏感性还是平衡性——在不确定性下评估负差异。
5.2.2. 对标准化差异性能的敏感性评估
敏感性分析的第二阶段专注于第6阶段(标准化差异得分),用于比较评估替代方案。该阶段考察了在四种可适应加权平均机制A?下,参数λ以0.1的增量变化对[7]的影响,其中?∈{I,II,III,IV}。在44个实验场景中,计算了所有替代方案的标准化正向差异得分NSP?λ(ai)和标准化负差异得分NSN?λ(ai)。此外,附录C中的图C.3和C.4分别展示了基于log2公式的标准化正向和负差异得分的相应敏感性结果。
图7展示了在不同场景下,三种替代方案的标准化正向差异得分NSP?λ(ai),以及四种可适应加权平均机制的结果,分别如图7(a)–(d)所示。在不同λ值和可适应的加权平均机制下,标准化的正散度得分。在AI机制下,图7(a)显示随着λ的增加,a2和a3的标准化得分呈现明显单调增加的趋势,而a1始终达到最大值。替代方案a1在所有λ值下保持固定为1.0000,表明其在正散度对齐方面持续占据主导地位。替代方案a2从0.4783稳步增加到0.6973,反映出逐渐的改进。替代方案a3从0.0543急剧上升到0.7891,在较高的λ值时最终超过a2。这些发现表明,随着散度权重的增加,AI促进了敏感性的提高和排名的逆转。图7(b)显示AII机制产生了不同的模式,其特征是a2的得分呈下降趋势,而a3的得分则有显著波动:(1)替代方案a1保持固定为1.0000;(2)替代方案a2的得分从0.4783稳步下降到0.2083,这意味着随着λ的增加,该方案的正面偏离减小;(3)替代方案a3的行为不单调,最初上升然后在0.2119和0.6296之间波动,在λ=0.3时出现显著上升(0.5154),随后出现下降和反弹。这种模式反映了较高的敏感性和波动性,使AII机制适合检测微妙的散度变化,但不太适合稳定的排名结果。图7(c)显示AIII机制产生了平衡且稳定的进展,a3在后期得分显著增加:(1)替代方案a2从0.4783增加到0.5741;(2)替代方案a3在λ=0.6后急剧上升,到λ=1.0时增加到0.8935;(3)像往常一样,a1保持恒定为1.0000。这种平衡的增长表明AIII机制提供了一个适度但敏感的散度响应,特别是在后期散度放大的方面。
在不同λ值和可适应的加权平均机制下,标准化的正散度得分。在AI机制下,图7(a)显示随着λ的增加,a2和a3的标准得分明显单调增加,而a1始终达到最高值。替代方案a1在所有λ值下保持固定为1.0000,表明其在正散度对齐方面持续占据主导地位。替代方案a2从0.4783稳步增加到0.6973,反映出逐渐的改进。替代方案a3从0.0543急剧上升到0.7891,在较高λ值时最终超过a2。这些发现表明,随着散度权重的增加,AI促进了敏感性的提高和排名的逆转。图7(b)显示AII机制产生了不同的模式,其特征是a2的得分呈下降趋势,而a3的得分则有显著波动:(1)替代方案a1保持固定为1.0000;(2)替代方案a2的得分从0.4783稳步下降到0.2083,这意味着随着λ的增加,该方案的正面偏离减小;(3)替代方案a3的行为不单调,最初上升然后在0.2119和0.6296之间波动,在λ=0.3时出现显著上升(0.5154),随后出现下降和反弹。这种模式反映了较高的敏感性和波动性,使AII机制适合检测微妙的散度变化,但不太适合稳定的排名结果。图7(c)显示AIII机制产生了平衡且稳定的进展,a3在后期得分显著增加:(1)替代方案a2从0.4783增加到0.5741;(2)替代方案a3在λ=0.6后急剧上升,到λ=1.0时增加到0.8935;(3)像往常一样,a1保持恒定为1.0000。这种平衡的增长表明AIII机制提供了一个适度但敏感的散度响应,特别是在后期散度放大的方面。
在不同λ值和可适应的加权平均机制下,标准化的正散度得分。在AI机制下,图7(d)显示得分范围较压缩,波动较小:(1)替代方案a2相对平稳,得分从0.4783略微下降到0.4130;(2)替代方案a3遵循非线性轨迹,在λ=0.8时达到峰值(0.5292),然后略微下降到0.4746;(3)替代方案a1再次保持恒定为1.0000。这种行为表明AIV可能提供适度的响应性,同时降低散度过度放大的风险,但与AI或AIII相比,它在不区分各选项方面不够明显。总体而言,AI和AIII在实现基于散度的清晰区分方面更为有效,特别是在排名逆转或后期放大具有信息价值时。相比之下,AII在增强对比度的同时牺牲了稳定性,而AIV提供了更保守和稳定的响应,适合需要控制敏感性的场景。
在不同λ值和可适应的加权平均机制下,标准化的负散度得分。图8描绘了三种替代方案在不同实验条件下的标准化负散度得分NSN?λ(ai)的轨迹。每个不同的可适应加权平均方案的结果分别在子图8(a)至8(d)中单独展示。下载:下载高清图像(437KB)下载:下载全尺寸图像。图8(a)–(d)显示NSN?λ(ai)的一致但不同的模式,反映了每种替代方案在不同加权方案下避免负散度的能力。在所有机制中,替代方案a3始终保持标准化得分1.0000,表明其无论在何种λ或聚合策略下都能最佳抵抗负散度。这突显了其在避免不良结果方面的结构稳健性。相比之下,a1和a2的行为在不同机制下有所不同:(1)在AI机制下(图8(a)),a1随λ的增加而稳步上升,在λ≥0.3时达到1.0000,而a2则单调下降,表明其对散度的敏感性增加;(2)在AII机制下(图8(b)),所有替代方案的得分都相对稳定且紧密聚集。虽然a3仍然占主导地位,但a1和a2在0.7左右略有波动,表明其表现适中但稳定;(3)在AIII机制下(图8(c),a1逐渐上升,直到λ=0.6,然后在λ=0.7时急剧下降,表明超过某个阈值后变得不稳定。同时,a2显示出稳定的下降趋势,表明其对负散度的抵抗力较弱;(4)在AIV机制下(图8(d),a1和a2都呈现下降趋势——特别是在λ=0.3至0.8之间——然后在较高λ值时部分恢复。这表明AIV放大了散度敏感性,但相比AI或AIII,它在区分各选项方面不够明显。
在不同λ值和可适应的加权平均机制下,标准化的负散度得分。图8描述了三种替代方案在不同实验条件下的标准化负散度得分NSN?λ(ai)的轨迹。每个不同的可适应加权平均方案的结果分别在子图8(a)至8(d)中单独展示。下载:下载高清图像(437KB)下载:下载全尺寸图像。图8(a)–(d)显示NSN?λ(ai)的一致但不同的模式,反映了每种替代方案在不同加权方案下避免负散度的能力。在所有机制中,替代方案a3始终保持标准化得分1.0000,表明其无论在何种λ或聚合策略下都能最佳抵抗负散度。这突显了其在避免不良结果方面的结构稳健性。相比之下,a1和a2的行为在不同机制下有所不同:(1)在AI机制下(图8(a)),a1随λ的增加而稳步上升,在λ≥0.3时达到1.0000,而a2则单调下降,表明其对散度的敏感性增加;(2)在AII机制下(图8(b)),所有替代方案的得分都相对稳定且紧密聚集。虽然a3仍然占主导地位,但a1和a2在0.7左右略有波动,表明其表现适中但稳定;(3)在AIII机制下(图8(c),a1逐渐上升,直到λ=0.6,然后在λ=0.7时急剧下降,表明超过某个阈值后变得不稳定。同时,a2显示出稳定的下降趋势,表明其对负散度的抵抗力较弱;(4)在AIV机制下(图8(d),a1和a2都呈现下降趋势——特别是在λ=0.3至0.8之间——然后在较高λ值时部分恢复。这表明AIV放大了散度敏感性,但相比AI或AIII,它在区分各选项方面不够明显。
在不同λ值和可适应的加权平均机制下,标准化的负散度得分。图8描述了三种替代方案在不同实验条件下的标准化负散度得分NSN?λ(ai)的轨迹。每个不同的可适应加权平均方案的结果分别在子图8(a)至8(d)中单独展示。下载:下载高清图像(437KB)下载:下载全尺寸图像。图8(a)–(d)显示NSN?λ(ai)的一致但不同的模式,反映了每种替代方案在不同加权方案下避免负散度的能力。在所有机制中,替代方案a3始终保持标准化得分1.0000,表明其无论在何种λ或聚合策略下都能最佳抵抗负散度。这突显了其在避免不良结果方面的结构稳健性。相比之下,a1和a2的行为在不同机制下有所不同:(1)在AI机制下(图8(a)),a1随λ的增加而稳步上升,在λ≥0.3时达到1.0000,而a2则单调下降,表明其对散度的敏感性增加;(2)在AII机制下(图8(b)),所有替代方案的得分都相对稳定且紧密聚集。虽然a3仍然占主导地位,但a1和a2在0.7左右略有波动,表明其表现适中但稳定;(3)在AIII机制下(图8(c),a1逐渐上升,直到λ=0.6,然后在λ=0.7时急剧下降,表明超过某个阈值后变得不稳定。同时,a2显示出稳定的下降趋势,表明其对负散度的抵抗力较弱;(4)在AIV机制下(图8(d),a1和a2都呈现下降趋势——特别是在λ=0.3至0.8之间——然后在较高λ值时部分恢复。这表明AIV放大了散度敏感性,但相比AI或AIII,它在区分各选项方面不够明显。
在不同λ值和可适应的加权平均机制下,标准化的负散度得分。图8描述了三种替代方案在不同实验条件下的标准化负散度得分NSN?λ(ai)的轨迹。每个不同的可适应加权平均方案的结果分别在子图8(a)至8(d)中单独展示。下载:下载高清图像(437KB)下载:下载全尺寸图像。图8(a)–(d)显示NSN?λ(ai)的一致但不同的模式,反映了每种替代方案在不同加权方案下避免负散度的能力。在所有机制中,替代方案a3始终保持标准化得分1.0000,表明其无论在何种λ或聚合策略下都能最佳抵抗负散度。这突显了其在避免不良结果方面的结构稳健性。相比之下,a1和a2的行为在不同机制下有所不同:(1)在AI机制下(图8(a)),a1随λ的增加而稳步上升,在λ≥0.3时达到1.0000,而a2则单调下降,表明其对散度的敏感性增加;(2)在AII机制下(图8(b),所有替代方案的得分都相对稳定且紧密聚集。虽然a3仍然占主导地位,但a1和a2在0.7左右略有波动,表明其表现适中但稳定;(3)在AIII机制下(图8(c),a1逐渐上升,直到λ=0.6,然后在λ=0.7时急剧下降,表明超过某个阈值后变得不稳定。同时,a2显示出稳定的下降趋势,表明其对负散度的抵抗力较弱;(4)在AIV机制下(图8(d),a1和a2都呈现下降趋势——特别是在λ=0.3至0.8之间——然后在较高λ值时部分恢复。这表明AIV放大了散度敏感性,但相比AI或AIII,它在区分各选项方面不够明显。
在不同λ值和可适应的加权平均机制下,标准化的负散度得分。图8描述了三种替代方案在不同实验条件下的标准化负散度得分NSN?λ(ai)的轨迹。每个不同的可适应加权平均方案的结果分别在子图8(a)至8(d)中单独展示。下载:下载高清图像(437KB)下载:下载全尺寸图像。图8(a)–(d)显示NSN?λ(ai)的一致但不同的模式,反映了每种替代方案在不同加权方案下避免负散度的能力。在所有机制中,替代方案a3始终保持标准化得分1.0000,表明其无论在何种λ或聚合策略下都能最佳抵抗负散度。这突显了其在避免不良结果方面的结构稳健性。相比之下,a1和a2的行为在不同机制下有所不同:(1)在AI机制下(图8(a),a1随λ的增加而稳步上升,在λ≥0.3时达到1.0000,而a2则单调下降,表明其对散度的敏感性增加;(2)在AII机制下(图8(b),所有替代方案的得分都相对稳定且紧密聚集。虽然a3仍然占主导地位,但a1和a2在0.7左右略有波动,表明其表现适中但稳定;(3)在AIII机制下(图8(c),a1逐渐上升,直到λ=0.6,然后在λ=0.7时急剧下降,表明超过某个阈值后变得不稳定。同时,a2显示出稳定的下降趋势,表明其对负散度的抵抗力较弱;(4)在AIV机制下(图8(d),a1和a2都呈现下降趋势——特别是在λ=0.3至0.8之间——然后在较高λ值时部分恢复。这表明AIV放大了散度敏感性,但相比AI或AIII,它在区分各选项方面不够明显。
在不同λ值和可适应的加权平均机制下,标准化的负散度得分。图8描述了三种替代方案在不同实验条件下的标准化负散度得分NSN?λ(ai)的轨迹。每个不同的可适应加权平均方案的结果分别在子图8(a)至8(d)中单独展示。下载:下载高清图像(437KB)下载:下载全尺寸图像。图8(a)–(d)显示NSN?λ(ai)的一致但不同的模式,反映了每种替代方案在不同加权方案下避免负散度的能力。在所有机制中,替代方案a3始终保持标准化得分1.0000,表明其无论在何种λ或聚合策略下都能最佳抵抗负散度。这突显了其在避免不良结果方面的结构稳健性。相比之下,a1和a2的行为在不同机制下有所不同:(1)在AI机制下(图8(a),a1随λ的增加而稳步上升,在λ≥0.3时达到1.0000,而a2则单调下降,表明其对散度的敏感性增加;(2)在AII机制下(图8(b),所有替代方案的得分都相对稳定且紧密聚集。虽然a3仍然占主导地位,但a1和a2在0.7左右略有波动,表明其表现适中但稳定;(3)在AIII机制下(图8(c),a1逐渐上升,直到λ=0.6,然后在λ=0.7时急剧下降,表明超过某个阈值后变得不稳定。同时,a2显示出稳定的下降趋势,表明其对负散度的抵抗力较弱;(4)在AIV机制下(图8(d),a1和a2都呈现下降趋势——特别是在λ=0.3至0.8之间——然后在较高λ值时部分恢复。这表明AIV放大了散度敏感性,但相比AI或AIII,它在区分各选项方面不够明显。
在不同λ值和可适应的加权平均机制下,标准化的负散度得分。图8描述了三种替代方案在不同实验条件下的标准化负散度得分NSN?λ(ai)的轨迹。每个不同的可适应加权平均方案的结果分别在子图8(a)至8(d)中单独展示。下载:下载高清图像(437KB)下载:下载全尺寸图像。图8(a)–(d)显示NSN?λ(ai)的一致但不同的模式,反映了每种替代方案在不同加权方案下避免负散度的能力。在所有机制中,替代方案a3始终保持标准化得分1.0000,表明其无论在何种λ或聚合策略下都能最佳抵抗负散度。这突显了其在避免不良结果方面的结构稳健性。相比之下,a1和a2的行为在不同机制下有所不同:(1)在AI机制下(图8(a),a1随λ的增加而稳步上升,在λ≥0.3时达到1.0000,而a2则单调下降,表明其对散度的敏感性增加;(2)在AII机制下(图8(b),所有替代方案的得分都相对稳定且紧密聚集。虽然a3仍然占主导地位,但a1和a2在0.7左右略有波动,表明其表现适中但稳定;(3)在AIII机制下(图8(c),a1逐渐上升,直到λ=0.6,然后在λ=0.7时急剧下降,表明超过某个阈值后变得不稳定。同时,a2显示出稳定的下降趋势,表明其对负散度的抵抗力较弱;(4)在AIV机制下(图8(d),a1和a2都呈现下降趋势——特别是在λ=0.3至0.8之间——然后在较高λ值时部分恢复。这表明AIV放大了散度敏感性,但相比AI或AIII,它在区分各选项方面不够明显。
在不同λ值和可适应的加权平均机制下,标准化的负散度得分。图8描述了三种替代方案在不同实验条件下的标准化负散度得分NSN?λ(ai)的轨迹。每个不同的可适应加权平均方案的结果分别在子图8(a)至8(d)中具体来说:
- 在AI条件下,当λ=0时,排序为a1?a2?a3,但随着λ的增加,排序变为a1?a3?a2,这表明对正向差异的重视程度在增加。
- 在AII和AIII中,当λ值较低(λ≤0.1)时也观察到类似的转变,此时a1?a2?a3是主导的;而当λ≥0.2时,排序变为a1?a3?a2。
- 值得注意的是,在AIII和AIV中,较高的λ阈值(例如λ≥0.7)会导致排序反转,更倾向于选择a3而非a1,这表明模型对差异不对称性更加敏感。
- 这些转变区域突显了模型在平衡稳定性和以差异为导向的评估之间的适应性。
当使用以2为底的对数时,排序结果在很大程度上与基于自然对数的变体相同,尤其是在λ值较低和中等的情况下:
- 在AI和AIII中,当λ∈{0,0.1}时,排序为a1?a2?a3;在AII中,当λ∈{0,0.1,0.2}时也是如此;在AIV中,当λ∈{0,0.1,0.2,0.3}时也是如此,这反映了最初对a1的强烈偏好。
- 随着λ的增加,排序变为a1?a3?a2,同时基于差异信息的调整提升了a3的排名。
两种变体之间的关键相似点包括:
- 两种对数变体都在广泛的λ值和聚合类型范围内表现出对a1作为最合适折中解决方案的稳健一致性,从而增强了方法的可靠性。
- 在这两种设置中,随着λ的增加,都观察到了明显的排序转变,这反映了结构稳定性与差异驱动的敏感性之间的权衡。
- 从a1?a2?a3到a1?a3?a2,最终到a3?a1?a2的转变模式是一致的,尽管它们发生的λ阈值略有不同。
关键差异如下:
- 基于自然对数的变体在更早的λ值(在AIII中为λ≥0.7,在AIV中为λ∈{0.6,0.7,0.8})就表现出排序转变,这表明其对差异幅度的敏感度更高,差异的放大也更快。
- 以2为底的对数变体更为保守,将a3的排名提升推迟到最高的λ值,在AIII中为λ∈{0.9,1},在AIV中为λ∈{0.9,1},这反映了更平滑的差异缩放和更高的排序稳定性。
- 这些行为差异表明,对数底数的选择影响了方法的可解释性和响应性,自然对数倾向于更鲜明的对比,而以2为底的对数则提供了更渐进的区分。
此外,使用Kendall的τ系数来定量评估不同参数设置下的排序稳定性,结果表明,从a1?a2?a3到a1?a3?a2的转变对应的Kendall的τ值为0.333,这反映了在参数变化范围内的高度一致性,只有第二和第三选择之间的位置调整很小。相反,转变为a3?a1?a2的Kendall的τ值为-0.333,表明了排序结构上的变化。值得注意的是,这种反转仅发生在AIII和AIV的较高λ值下,此时差异效应变得主导。这种转变不是突然的,而是逐渐发生的,显示出受控的敏感性而非不稳定性。总体而言,Kendall的τ分析证实了所提出的基于KL差异的CIF评估框架在低到中等差异范围内的高排序稳定性,同时允许在高差异条件下进行可解释和渐进的排序转变。这种在稳健性和适应性之间的平衡突显了该方法适用于不确定性感知的决策制定。
5.3.2. 与现有决策模型的比较结果分析
所提出的基于KL差异的评估框架在概念上基于EDAS原则,该原则根据与基准平均解的有利和不利偏差来评估选项。然而,与传统的对称距离度量不同,本研究通过引入差异度量——特别是基于CIF的KL差异——来更好地捕捉CIF环境中的不对称性、犹豫和方向不确定性,从而扩展了EDAS范式。这种增强提高了评估过程在复杂不确定性下的稳健性和区分能力。基于这一基础,与现有的基于CIF的EDAS模型进行基准测试在方法论上是合理且必要的。
为此,选定了两种代表性的CIF EDAS方法作为主要基准。第一种是由Imran和Ullah [36]提出的模型,它将经典的EDAS方法扩展到了CIF领域,同时保持了其原始结构。通过将CIF数字整合到EDAS框架中,该模型增强了多属性决策中的模糊性和犹豫处理能力。实证验证了其在复杂工业环境中的稳健性和适应性。由于其结构上的忠实性和方法论上的简单性,该模型成为无需重大概念修改的基于CIF的EDAS的基准参考。比较考虑了在参数值从0.0到1.0(步长0.1)范围内,通过加权和几何聚合获得的评估分数和排名。
第二种基准是Chen [34]开发的扩展CIF EDAS框架,它在经典EDAS结构的基础上引入了方法论上的改进,包括高级聚合策略、精细的评估标准和对不确定性和犹豫的改进建模。通过结合优先级加权方案和基于锚定数据的指标,该模型重新定义了正负偏差,并提出了基于成员函数加权总和的修改后的EDAS决策规则。其有效性通过实际应用和比较研究得到了验证。这种模型代表了更高级和灵活的CIF EDAS变体,比较评估了在参数值从0.0到1.0范围内的评估分数和排名。
这两种方法反映了CIF EDAS研究中的关键发展方向:一种强调结构连续性和简单性,另一种侧重于方法论上的丰富性和表达灵活性。它们的包含为评估所提出的基于差异的框架的附加值提供了全面的基础。
此外,还包括了WSM、WPM和WASPAS模型,因为它们在多标准决策制定中的广泛应用和基础性作用。这些方法分别代表加法、乘法和混合聚合逻辑。为了确保可比性,所有三种模型都使用CIF算术操作扩展到了CIF上下文,并与本研究中提出的可适配加权平均机制A?(?∈{I,II,III,IV}进行了集成。此外,实现了Chen [42]引入的参数化评分规则,以确保评估逻辑的一致性。对于WASPAS,加权参数从0.1变化到0.9,以捕捉WSM和WPM之间的混合聚合行为。
最后,还包括了Chen [2]提出的CIF ELECTRE I和II方法作为高级比较模型。这些方法在ELECTRE框架内整合了基于差异和相似性的度量,从而能够精细评估相对于理想和反理想的优劣比较。该方法论结合了增强的一致性和不一致性度量,并遵循了一个结构化的多阶段评估过程。其有效性在相同的AI增强型CDSS评估环境中得到了验证,确保了实证比较的一致性。因此,这些方法为评估所提出的基于KL差异的框架的性能提供了严格的基准。
表10总结了所有方法的比较结果,分为三类:
(1) 与基于CIF EDAS的模型的比较,包括Imran和Ullah [36]以及Chen [34]的方法;
(2) 与经典基准模型的比较,包括基于CIF的WSM、WPM和WASPAS;
(3) 与高级排序模型的比较,特别是Chen [2]提出的CIF ELECTRE I和II框架。
• 与代表性CIF EDAS技术的性能差异
表10. 多种决策框架下的比较排名结果
比较模型 核心概念 完整或部分排名结果 最佳选择或折中解决方案
CIF EDAS模型(Imran和Ullah [36]提出) •CIF加权平均和几何运算 •基于加权平均的评估分数:
• 基于评分函数的平均正负距离–加权参数∈{0,0.1,0.2}:a1?a2?a3–
• 加权参数∈{0.3,0.4,?,1}:a2?a1?a3–
• 基于几何平均的评估分数:–加权参数∈{0,0.1,?,1}:a2?a1?a3–
扩展的CIF EDAS模型(Chen [34]提出) •保守和激进的估计 •评估参数∈{0.1,0.2,?,0.5}:a2?a1?a3•
• 评估参数∈{0.1,0.2,?,0.5}:a2
• 基于锚定数据的指标 •评估参数∈{0.6,0.7,?,1}:a1?a2?a3•
• 评估参数∈{0.6,0.7,?,1}:a1
CIF WSM模型 •CIF加权平均运算符 •采用AI-III:a1?a2?a3•
• 采用AI-IV:a1
• 适应性加权平均机制 •采用AIV:a1?a3?a2
• 参数化评分规则
CIF WPM模型 •CIF加权几何运算符 •采用AI-III:a2?a3?a1•
• 采用AI-III:a2
• 适应性加权平均机制 •采用AIV:a1?a3
• 采用AIV:a1
CIF WASPAS模型 •CIF算术运算 •采用AI-III:•
• 采用AI-III:•
• 参数化评分规则–WASPAS参数=0.1:a1?a2?a3–
• WASPAS参数=0.1:a1
• 混合评估加法和乘法逻辑–WASPAS参数∈{0.2,0.3,0.4}:a2?a1?a3–
• WASPAS参数∈{0.5,0.6,?,0.9}:a2?a3?a1•
• 采用AIV:–
• WASPAS参数∈{0.1,0.2,?,0.9}:a1?a3?a2–
• 参数∈{0.2,0.3,?,0.9}:a2
CIF ELECTRE I模型(Chen [2]提出) •基于相似性的评估指标 •基于相似性的不一致性指标 •差异驱动的不一致性指标•类型I配置:–
• 类型I配置:a2?a1, a2?a3, a1?a3–
• 类型II, IV, V, VII:a1?a2, a1?a3, a2?a3–
• 类型III:a1?a3, a2?a3–
• 类型VI:a2?a1, a2?a3–
• 类型II配置:–
• 类型I, III:a1, a2–
• 类型II, IV, V, VII:a1–
• 类型III:a1, a2–
• 类型IV, V, VII:a1–
• 类型V:a2?a1, a2?a3–
• 类型VI:a2–
• 类型VIII:–
• 类型V配置:–
• 类型I, III配置:a2?a1, a2?a3–
• 类型VII:a1?a3, a2?a3–
• 类型VI:a2–
• 类型VII:a2–
• 类型VIII配置:–
• 类型VIII配置:–这在纵向决策环境或群体决策情境中尤其具有优势,在这些情境中一致性至关重要。总之,所提出的基于KL散度驱动的CIF评估模型不仅在排名一致性和可解释性方面优于现有的CIF EDAS方法,而且还引入了一种基于概念的机制来管理决策中的不确定性和不对称性——解决了先前模型中观察到的关键局限性。
•与基准决策模型相比的结果
通过将KL散度驱动框架与代表性的基于CIF的评分模型(即CIF WSM、CIF WPM和CIF WASPAS)进行基准测试,评估了其稳健性和有效性——这些模型用于选择增强人工智能的CDSS提供商。为了提高一致性,将自适应加权平均机制A?纳入了WSM和WPM结构中,从而在CIF设置中实现了加权和几何聚合。表10的第三到第五节报告了不同配置(AI-AIV)下的排名结果和最优选择。
基于加权平均和参数化评分的CIF WSM模型在所有配置中始终将a1识别为排名最高的选项。在AIV下,a3取代了a2,但a1仍然占据主导地位。虽然这反映了强烈的稳定性和决策性,但对a1的统一偏好可能低估了标准之间的乘法交互作用和相对差异。相比之下,采用几何聚合的CIF WPM模型表现出更大的排名变异性。在AI-AIII下,a2始终排名第一,而在AIV下,a1变得占主导地位,a2和a3并列。这种行为表明乘法结构放大了标准之间的对比,导致更高的敏感性和情景依赖性排名。
CIF WASPAS模型通过参数化方案结合了加法和乘法组件,展示了基于上下文的适应性。在较低的参数值(0.1)下,a1在AI-AIII下排名第一。然而,随着参数的增加(0.2–0.9),a2变得占主导地位——在参数∈{0.2,0.3,0.4}时a1排在前面,在参数∈{0.5,0.6,?,0.9}时a3排在前面。在AIV下,a1始终是首选。这些变化说明了WASPAS的灵活性,但也引入了由于频繁变化而导致的解释复杂性。
相比之下,所提出的基于KL散度驱动的框架在方法论和实际应用上都具有明显的优势。如表9所示,该模型结合了自然对数和以2为底的公式,并在不同的λ值和聚合机制下进行了评估。它的关键优势包括:
(1)情境敏感的区分:与传统的加法或乘法模型不同,基于KL的方法能够在替代方案之间进行适应性区分。尽管在大多数配置下a1更受青睐,但在较高的λ水平(例如,在AIII和AIV下λ≥0.7)下,a3成为主导选项,揭示了在散度密集条件下的潜在优势。
(2)双对数稳健性:自然对数和以2为底的变体都产生了一致且可解释的排名转换。自然对数倾向于较早地区分选项,而以2为底的变体提供了更平滑的转换,增强了在不同缩放视角下的稳健性。
(3)精细的参数控制:λ参数允许精确调整散度敏感性,使决策者能够模拟从稳定性导向(λ≈0)到散度驱动(λ≈1)的连续评估态度。
总体而言,所提出的基于KL散度驱动的模型在灵活性、解释深度以及对不确定性和偏好变异性的敏感性方面优于传统的CIF WSM、WPM和WASPAS方法。虽然成熟的模型提供了计算上的简洁性,但它们可能忽略了在不同标准下替代方案表现的重要变化。相比之下,基于KL的模型有助于对增强人工智能的CDSS提供商进行全面和细致的评估,从而确立了它作为一个在不确定性环境中进行决策的有力工具。
•与其他决策模型相比的结果
Chen [2]提出的CIF ELECTRE I和II框架被应用于选择增强人工智能的CDSS提供商的问题中,以研究不同的排名配置和推理类型如何影响替代方案的优先级。表10的第六和第七节报告的结果显示了配置类型和模型结构之间的显著差异。
在CIF ELECTRE I模型下,不同替代方案之间的偏好顺序在五种推理配置(Type-i至Type-v)中发生了显著变化。特别是:
- Type-i配置:最佳选择在不同配置中变化较大,a2在Type I和VI中成为首选,而a1在Type II、IV、V和VII中占主导地位。Type-III显示a1和a2之间有平局,反映了在某些评估结构下的排名不稳定性。
- Type-ii和Type-v配置:这些配置在大多数设置(Type II、IV、V、VII)中更支持a1,而在Type-VI中a2获得了偏好,在Type I和III中与a1并列。
- Type-iii和Type-iv配置:观察到了类似的差异;Type I、III和VI一致支持a2,而在Type II、IV、V和VII中a1占主导地位。这种模式反映了基于排名方向性和不可比性阈值的偏好聚合中的敏感性效应。
CIF ELECTRE II模型旨在捕捉强和弱的排名关系,通常在各种配置下产生更稳定和传递性的排名结果:
- Type-i、Type-ii和Type-v配置:在大多数情况下(Type I–V, VII),a1始终排名最高,明显优于a2和a3。只有Type-VI例外,它将a2排在首位。
- Type-iii和Type-iv配置:这些配置在Type I、III和VI中更支持a2,而在Type II、IV、V和VII中再次支持a1。值得注意的是,a1?a2?a3或a2?a1?a3的传递性在大多数设置中得到了保持,表明与ELECTRE I相比内部一致性得到了增强。
综合这些发现,CIF ELECTRE I和II都能够捕捉在不同推理假设下的多样化主导结构。然而,它们对特定配置的设置表现出显著的敏感性——特别是ELECTRE I,其中经常出现相互矛盾的最佳替代方案(例如,a1 vs. a2)。相比之下,所提出的基于KL散度驱动的CIF评估框架作为EDAS范式的扩展,提供了几个关键优势:
(1)跨配置的稳健性:通过将KL散度整合到EDAS结构中,该模型在不同的加权方案和参数设置下产生了一致且可解释的排名,减少了波动性并增强了决策的可靠性。
(2)以散度为导向的敏感性:该框架通过结合CIF特定组件(例如基于半径的项和稳定因子)扩展了经典的KL散度,使得能够检测到不确定性能概况中的细微差异——这是传统EDAS或排名方法中未明确处理的能力。
(3)增强的区分能力:通过同时考虑相对于极端基准的正负散度,该模型在区分替代方案时实现了更细粒度,特别是在性能差异微小但决策关键时。
总体而言,尽管CIF ELECTRE I和II强调了推理假设对排名结果的影响,但所提出的基于KL散度驱动的框架展示了更高的稳定性、敏感性和区分能力。这些优势在增强人工智能的CDSS评估中尤为重要,因为在这种情况下,不确定性、异构标准和专家意见分歧需要稳健且可解释的决策支持。
•使用Kendall的τ进行跨方法定量比较
为了定量评估所提出的基于KL散度驱动框架与现有决策模型之间的一致性,采用了Kendall的τ相关系数。该指标用于评估成对排名的一致性,特别适用于小规模决策问题。从所提出的方法中获得的三种代表性排名模式用作参考基线,分别是:R1:a1?a2?a3,R2:a1?a3?a2,R3:a3?a1?a2。平均Kendall的τ值是每种基准方法的排名结果与所提出的方法的三种代表性排名模式(R1–R3)之间所有成对比较的算术平均值。对于涉及平局的情况(例如,a2a3),采用了Kendall的τ-b近似。此外,为了更全面地评估排名一致性,通过结合不同参数设置和聚合机制下的排名发生频率进行了加权Kendall的τ分析。这种方法反映了每种方法的主导行为模式,并避免了均匀平均带来的偏差。
结果表明,CIF WSM模型与所提出的框架之间的一致性最强(相对于R1的加权τ = 0.833,相对于R2的加权τ = 0.500),表明加法聚合结构与所提方法的排名行为非常吻合。CIF ELECTRE II模型也与主导排名模式R1高度一致(加权τ = 0.790),同时对R2有弱正相关性(加权τ = 0.124),而在R3下有中等程度的差异(加权τ = ?0.466)。这表明,尽管排名机制捕获了主要偏好结构,但在不同的配置下产生了部分不同的结果。扩展的CIF EDAS和CIF EDAS模型与R1有中等程度的一致性(加权τ = 0.667和0.424),但与R2和R3的相关性较低或为负。这表明这些模型部分捕获了主导排名模式,但在强调替代方案偏好结构时缺乏一致性。相比之下,CIF WASPAS模型在所有排名模式中的一致性都很弱(加权τ = 0.111、?0.222和?0.333),反映了参数设置的敏感性和排名行为的不稳定性。
表11. 使用Kendall的τ对所提出的方法和基准模型进行跨方法比较。
比较模型 | 排名模式 | 频率 | τ vs R1 | τ vs R2 | τ vs R3 | 加权τ vs R1 | 加权τ vs R2 | 加权τ vs R3 | 解释
| --- | --- | --- | --- | --- | --- | --- | --- |
| CIF EDAS模型 | a1?a2?a3 | 3 | 1.000 | 0.333 | ?0.333 | 0.424 | ?0.242 | ?0.909 | 中等一致性,但在R3下差异较大 |
| 扩展的CIF EDAS模型 | a1?a2?a3 | 5 | 1.000 | 0.333 | ?0.333 | 0.667 | 0.000 | ?0.667 | 与a2?a1?a3的中等一致性,但在不同模式下不稳定 |
| CIF WSM模型 | a1?a2?a3 | 3 | 1.000 | 0.333 | ?0.333 | 0.833 | 0.500 | ?0.167 | (大多数情况下一致性强) |
| CIF WPM模型 | a1?a3?a2 | 3 | ?0.333 | ?1.000 | ?0.333 | ?0.046 | ?0.546 | 高度不稳定(最低) |
| CIF WASPAS模型 | a1?a2?a3 | 3 | 1.000 | 0.333 | ?0.333 | ?0.222 | ?0.333 | 结构不稳定 |
| a2?a1?a3 | 9 | 0.333 | ?0.333 | ?1.000 | 一致 |
| a2?a3?a1 | 15 | ?0.333 | ?1.000 | ?0.333 | a1?a3?a2 | 9 | 0.333 | 1.000 | 0.333 | 稳定 |
| CIF ELECTRE II模型 | a1?a2?a3 | 2 | 1.000 | 0.333 | ?0.333 | 0.790 | 0.124 | ?0.466 | 与a2?a1?a3高度一致 |
备注:R1:在(i)AI,λ=0;(ii)AII,λ∈{0,0.1};(iii)AIII,λ∈{0,0.1};(iv)AIV,λ∈{0,0.1,0.2}下,a1?a2?a3。R2:在(i)AI,λ∈{0.1,0.2,?,1};(ii)AII,λ∈{0.2,0.3,?,1};(iii)AIII,λ∈{0.2,0.3,?,0.6};(iv)AIV,λ∈{0.3,0.4,0.5,0.9,1}下,a1?a3?a2。R3:在(i)AIII,λ∈{0.7,0.8,0.9,1};(ii)AIV,λ∈{0.6,0.7,0.8}下,a3?a1?a2。
尽管CIF WSM和CIF ELECTRE II模型在与主导排名模式(R1)相关的加权Kendall的τ值方面表现出相对较高的水平,但这种一致性主要反映了结构稳定性而非真正的适应性。CIF WSM的加法性质倾向于保持固定的排名,而CIF ELECTRE II在其排名逻辑下倾向于保持一致的排序。因此,这两种方法在捕捉细微的偏好变化和不确定性条件下的变化方面都有限。相比之下,所提出的基于KL散度驱动的框架结合了信息论散度和参数化加权(λ),使其能够捕捉替代方案之间的非对称和分布敏感的差异。该框架在所有配置下保持了结构和可解释的排名转换,主要从a1?a2?a3转变为a1?a3?a2,只有在高λ条件下才会转变为a3?a1?a2。这种渐进且受控制的演变与一些基准方法中观察到的更突然或不稳定的排名变化形成对比。
与要么专注于主导排名(例如,CIF WSM、CIF ELECTRE II)要么表现出不稳定行为(例如,CIF WASPAS、CIF WPM)的基准方法相比,所提出的框架实现了稳定性和适应性的平衡整合。这种适应性本质上根植于基于散度的公式,它动态调整了中心趋势和不确定性分布的影响,从而在各种条件下实现情境敏感的评估。这种能力在现实世界的决策场景中特别有价值,例如在选择增强人工智能的CDSS提供商时,其中标准是异构的、相互依赖的,并且充满不确定性。所提出的框架支持稳定的核心排名和灵活的调整,促进了更可靠和情境意识的决策。
总之,来自敏感性分析、区分能力和加权Kendall的τ的综合证据表明,所提出的框架不仅与主导排名结构保持了强烈的一致性,还支持了替代方案偏好模式之间的结构化和可解释的转换。因此,其优势不在于与单一排名结果的最大化一致性,而在于在复杂不确定性下提供连贯、适应性和信息敏感的决策支持。
5.4. 可扩展性和实际应用性
尽管本文中介绍的示例案例涉及一个相对较小的决策矩阵(3个替代方案×9个标准),但所提出的基于CIF的KL散度框架在计算上可以扩展到更大的决策环境。如4.4小节所讨论的,算法的计算复杂性主要随着替代方案的数量(ζ)、标准数量(ξ)和决策者数量(o)的增长而增加,因为主要操作包括对CIF值元素的散度评估和聚合程序。这些计算与评估矩阵的大小成线性比例。
在实践中,该算法涉及三个主要的计算阶段:(i)将语言评估转换为IF表示,(ii)进行几何聚合以构建CIF值评估和标准重要性值,以及(iii)在EDAS评估程序中使用的基于散度的计算。这些操作对每个替代方案-标准对独立执行,允许框架随着决策矩阵的扩展而保持线性计算增长。因此,所提出的方法可以轻松应用于涉及更多替代方案、标准和决策者的更高维度决策问题。即使在大规模决策环境中,计算负担仍然是可以管理的,因为底层的计算主要涉及对数运算和聚合过程,这些可以在现代数值计算环境中高效实现,并在必要时进行并行化。然而,在大规模CIF决策问题中可能会出现实际挑战,特别是在从多位专家那里获取和管理可靠的语言评估以及不确定性表示的复杂性增加方面。在这种情况下,仔细设计语言评估量表和适当的聚合策略对于确保基于CIF的评估在复杂决策环境中的可解释性和稳定性至关重要。实际上,有几项指南可以帮助促进所提出框架在大型设置中的应用。首先,使用结构良好、层次数量适中的语言量表(例如七点或九点)可以帮助决策者提供一致的评估,同时保持足够的分辨率。其次,可以纳入专家之间的一致性检查或共识构建程序,以减少个别评估中的极端差异。第三,当标准或选项的数量很多时,通过向量化实现或并行处理CIF聚合和差异计算可以进一步提高计算效率。
6. 结论与未来方向
本研究开发了一个基于KL散度的评估框架,专门针对CIF环境,以增强在不确定性下的决策能力。通过将CIF特有的结构——成员身份、非成员身份、犹豫和径向不确定性——整合到通用的KL散度公式中,该框架提供了一种理论上有根据且计算上稳定的方法,用于量化CIF值评估中的差异。在此基础上,该研究引入了基于KL的显著性指标和评估指标、由散度引起的指标以及多标准决策分析的集成评估机制。对增强型CDSS提供商选择的实证应用验证了所提出框架的可行性和有效性。结果表明,该模型能够区分细微的性能差异,保持稳定的排名行为,并适应不同的参数配置。敏感性分析进一步显示,参数λ提供了从以稳定性为导向的评估到以散度为导向的差异化的平滑过渡,从而可以灵活控制对不确定性的敏感性。在不同的聚合机制下,该框架一致地识别出a1是在中等条件下的最稳健的选项,而在更高的散度强调下,a3显示出依赖于上下文的竞争力。比较基准分析证实,与现有的CIF EDAS、基于评分的方法(WSM、WPM、WASPAS)以及排序范式(CIF ELECTRE I和II)相比,所提出的方法在稳定性、可解释性和区分能力上有所改进。
尽管有这些优点,但仍需承认几个局限性。首先,对参数λ的探索基于离散网格,可能无法捕捉更精细的敏感性模式。其次,聚合操作符的集合仅限于四种代表性机制,可能会限制不确定性传播行为的多样性。第三,实证验证基于单一案例研究,特定排名模式的普遍性可能需要在不同领域进一步验证。最后,使用固定的全球参考基准可能无法完全反映动态或依赖于上下文的偏好结构。
未来的研究可以在几个方向上扩展这项工作。对λ进行自适应或数据驱动的调优可以增强敏感性校准。将聚合框架扩展到包括替代操作符(例如基于熵的、Choquet积分或混合方法)可以提供更丰富的建模能力。还需要在多样化领域(如可持续供应链、智能基础设施和能源系统)中进行进一步的实证验证。此外,开发动态的或适应利益相关者的基准,并将框架与其他基于相似性或距离的方法结合起来,可以进一步提高其在复杂决策环境中的适用性。总体而言,基于KL散度的框架为CIF决策分析建立了一个稳健、透明且灵活的范式,使我们能够在复杂的现实世界环境中进行更稳定、适应性强且考虑不确定性的评估。
**符合伦理标准**
本文不包含任何由作者进行的涉及人类参与者或动物的研究。