摘要
尽管全信息最大似然(FIML)估计广泛应用于诊断分类模型(DCMs),但其计算效率在高维环境中会显著下降。随着DCMs被应用于大规模评估、心理测试和涉及多个属性的纵向研究,这一可扩展性问题变得越来越关键。我们提出了一种基于期望最大化(EM)算法的复合边际似然(CML)估计方法(CML-EM),作为高阶DCMs(HO-DCMs)的替代方案。其核心思想是:由于响应概率仅依赖于Q矩阵所指定的属性,并且基于HO-DCMs的条件独立性假设,因此可以将整个似然函数分解为低维的属性和项目子集。这样在E步骤中,属性和响应空间的维度都缩小到了每个子集的维度,从而大幅提高了计算效率,尤其是在样本量较大或属性数量较多时。我们还引入了一种子集构建流程,以确保CML-EM的高效率和可行性,并展示了两种属性分类方法。仿真结果表明,CML-EM的速度明显快于FIML,同时仍能保持参数估计的准确性和良好的分类性能。该方法的实际应用价值通过一个高维人格评估案例得到了进一步证明。
利益冲突声明
作者声明没有利益冲突。
数据可用性声明
本研究使用了公开可用的IPIP–NEO–120数据集(Johnson, 2014),该数据集可通过Open Science Framework在https://osf.io/wxvth/获取。分析代码目前尚未公开,但将来会提供。


