《Discover Public Health》:Cluster analysis of national survey data identifies biopsychosocial profiles of adults with diabetes in Chile
编辑推荐:
为了解决糖尿病患者群体常被同质化对待而忽视了其内在异质性的问题,研究人员基于智利2016-2017年全国健康调查(ENS)数据,对652名糖尿病患者进行了生物心理社会特征的聚类分析,得出了7个不同的患者类型,并通过对比揭示了高风险与低风险群体的显著差异。这项研究表明,在糖尿病分层中纳入心理社会与结构性决定因素具有重要意义,有助于制定更有针对性的预防和管理策略。
糖尿病(Diabetes Mellitus, DM)已成为全球性的健康挑战,其发病率持续攀升,带来了沉重的疾病负担和高昂的医疗成本。尤其在智利,糖尿病的成人患病率高居南美洲第二,数以百万计的患者正面临着失明、肾衰竭等严重并发症的威胁。尽管有像智利国家健康调查(Encuesta Nacional de Salud, ENS)这样大规模的数据集,但传统上,研究者往往将糖尿病患者视为一个单一、同质的群体。这好比将形态各异的树木视为同一片森林,虽然便于整体描述,却忽略了森林内部不同区域的气候、土壤和植被的巨大差异。在现实中,每位糖尿病患者的健康状况、生活习惯、心理状态和社会经济背景千差万别,这些差异可能深刻影响着疾病的进展和预后。然而,在智利,使用综合性的生物心理社会方法在国家层面探索这种异质性的研究尚不多见。这种“一刀切”的认知方式,是否阻碍了更精准、更有效的公共卫生干预策略的制定?这正是本研究试图解答的核心问题。
为了揭开智利糖尿病患者群体的内在多样性,研究者们进行了一项开创性的探索。他们决定采用一种名为聚类分析的统计“探照灯”,来照亮这一群体内部隐藏的结构。这项研究利用智利2016-2017年ENS的公开数据,将目光聚焦于那些通过医生或其他健康专业人员明确诊断为糖尿病的652名15岁及以上参与者。研究团队没有局限于传统的生理指标,而是精心选取了多达22个变量,打造了一个“生物心理社会”全景画像。这幅画像不仅描绘了体质指数(BMI)、腰围、高血压等生理健康状况,也记录了水果蔬菜摄入、体力活动等生活习惯,还涵盖了教育水平、家庭收入等社会经济因素,以及抑郁症状等心理状态。这种综合视角旨在更全面地捕捉影响糖尿病管理、心血管代谢风险和并发症发展的个体差异。通过为不同变量赋予基于流行病学证据的权重,并使用能够同时处理数值型和分类型数据的高尔(Gower)系数来计算个体间的相似性,研究人员最终运用k-中心点(k-medoids)算法,成功将这群糖尿病患者划分为了七个各具特色的“部落”。
3.1 变量选择与聚类
研究人员首先筛选出652名诊断一致的糖尿病患者样本。在尝试了多种层次聚类方法后,发现沃德(Ward)法未出现倒置问题,但当聚类数小于300时,其形成的聚类质量并不优于随机排列数据形成的聚类。随后,他们采用k-中心点法进行分析,并引入轮廓系数(Silhouette Coefficient, SC)来评估聚类质量。通过将实际数据与999个随机排列版本的数据进行对比,发现当聚类数为7时,所得聚类的轮廓系数显著高于随机情况,这表明“七分法”具有统计学意义上的凝聚性和分离性,并非偶然。
3.2 聚类特征分析
研究详细描述了七个聚类的特征,并特别选取了轮廓系数相对较高且特征迥异的第6类和第7类进行深入对比,两者在健康习惯、健康状况和社会结构因素上呈现出鲜明对立。
在健康习惯方面,第6类人群每周水果和蔬菜的总摄入量中位数区间少于7份,而第7类则在14至20份之间;第6类中仅有约五分之二的人体力活动水平较高,而第7类中这一比例接近五分之四。第6类人群阳光照射充足的比例也远低于第7类(22%对61%)。
在健康状况上,第6类的平均BMI为33.37 kg/m2,平均腰围为106.16厘米,远高于第7类的28.16 kg/m2和95.44厘米。这与他们的生理指标一致:第6类中分别有91%和92%的人被诊断患有高胆固醇血症和动脉高血压,而第7类的比例仅为32%和35%。在心理健康方面,第6类有50%的人报告有抑郁诊断,36%的人在调查时呈现一种或多种抑郁症状;第7类这两个比例分别仅为11%和12%。
在社会结构决定因素上,第6类中84%为女性,而第7类中女性仅占36%。第6类的家庭月收入中位数区间([204, 329]美元)低于第7类([446, 579]美元)。教育程度上,第6类大多数(68%)仅完成初等教育,第7类则拥有更高的教育水平(初等28%,中等28%,高等32%)。在地域分布上,第6类受访者一半集中于南部和极南地区,而第7类在全国分布更为均匀。尽管年龄未参与聚类,但数据显示两组人群均以中老年为主,第6类年龄中位数为66岁,第7类为62岁。此外,研究未发现在吸烟、糖尿病药物管理或认知功能测试等变量上形成有意义的聚类模式。
这项研究的核心发现是,在智利的糖尿病患者群体中,存在着清晰可辨的生物心理社会异质性。通过聚类分析识别出的七个类别,特别是作为典型案例的第6类(高风险群)与第7类(低风险群),生动地展示了糖尿病并非孤立存在,而是嵌入在复杂的个体生活背景之中。第6类人群展现出的是一幅“多重脆弱性”叠加的图景:他们在生理上承受着肥胖、高血压、高胆固醇等多重负担;在心理上面临更高的抑郁风险;在社会经济层面则处于教育水平低、收入微薄的困境;在行为习惯上表现为蔬果摄入不足、活动较少。这种生物、心理、社会及行为风险因素的“共现”现象,使得该群体发展各类并发症的易感性极高。与之形成鲜明对比的第7类人群,其糖尿病状态则显得相对“孤立”,他们拥有更健康的生理指标、更积极的生活习惯和更优越的社会经济条件。
这一对比强烈提示,对于糖尿病的管理和预防,采取“一刀切”的策略可能是低效甚至不公平的。对于像第6类这样的高风险群体,常规的、以疾病为中心的管理模式可能不足以应对其错综复杂的脆弱性网络,他们需要更整合、更强调社会心理支持、更关注社会决定因素的干预措施。而对于第7类群体,标准的疾病管理方案可能就已足够。这为实施更精准、分层级的公共卫生策略提供了实证依据。
研究的意义在于其方法论和视角的创新。它将心理社会和结构性因素与传统的生物医学指标置于同等重要的位置,采用聚类分析这一数据驱动的方法,揭示了患者群体内部“自然形成”的亚组结构。这超越了以往研究多关注单一社会经济指标与糖尿病关联的层面,推动了从“风险梯度”分析向“风险构型”识别的范式转变。尽管研究存在一些局限,如数据来源于新冠肺炎(COVID-19)疫情前、无法区分1型糖尿病(T1D)与2型糖尿病(T2D)、自我报告数据可能存在偏差,以及未使用调查权重进行人口推估等,但它为理解糖尿病在人群中的真实分布形态提供了宝贵的基础。它生成的关于不同风险构型与并发症易感性关系的假设,为未来的纵向研究指明了方向,并最终有望助力设计出能真正回应不同群体需求的、更具针对性和公平性的糖尿病防控体系。