多等位基因Moran过程的投票者模型表征:从充分混合种群到复杂网络的精确平稳分布与多样性阈值

《Journal of Theoretical Biology》:A voter-model representation of the multi-allelic Moran process: exact stationary distributions and diversity thresholds from well-mixed populations to complex networks

【字体: 时间:2026年06月03日 来源:Journal of Theoretical Biology 2

编辑推荐:

  研究人员将有限种群中双等位基因Moran过程与双候选人投票者模型之间的等价性,推广到具有父本无关突变(PIM)的多等位基因Moran过程以及多候选人投票者模型。这一精确映射使得研究人员能够简洁地导出:在规模为n、等位基因数为任意m的充分混合种群中,带标签的等位

  
研究人员将有限种群中双等位基因Moran过程与双候选人投票者模型之间的等价性,推广到具有父本无关突变(PIM)的多等位基因Moran过程以及多候选人投票者模型。这一精确映射使得研究人员能够简洁地导出:在规模为n、等位基因数为任意m的充分混合种群中,带标签的等位基因计数向量的有限种群Dirichlet–multinomial平稳分布。该映射还给出临界突变阈值uc=1/(m+2n?2),并显式揭示其对m的依赖性。随后,研究人员将分析扩展至以Erd?s–Rényi相互作用网络表征的随机连接种群。在ER均值场约化下,Moran平稳分布及其对应的多样性阈值uc保持不变,并与充分混合情形一致,尽管对应的投票者模型在稀疏随机网络上表现出被放大的顽固者(zealot)影响。最后,对若干稀疏且具有结构性的网络拓扑,包括Erd?s–Rényi、无标度、环形与小世界网络的模拟表明,结构异质性能够显著重塑平稳等位基因分布,并进而改变遗传多样性水平。更广泛地说,本文建立的这种对应关系将投票者模型视角转化为分析多等位基因Moran过程的一个可处理框架,从而得到平稳分布律、临界突变阈值,并为网络结构如何塑造平稳多样性提供新的认识。
本文发表于《Journal of Theoretical Biology》,核心目标是在有限种群框架下,为多等位基因中性Moran过程建立一个严格、可解析且可推广到网络结构的理论表述。研究背景在于,群体遗传学中突变与遗传漂变是决定遗传变异长期维持与丧失的两种基本随机机制。经典双等位基因Moran过程已经充分揭示了有限种群中漂变与突变的竞争关系,并给出在有突变时的唯一平稳分布以及临界突变率所对应的分布形态转变。然而,现实生物系统很少局限于双等位基因:即便是单核苷酸位点也天然对应4种可能状态,而诸如人类白细胞抗原(HLA,主要组织相容性复合体相关高多态区域)等位点更呈现高度多态性。因此,建立多等位基因有限种群中性模型的显式平稳理论,不仅具有生物学直接意义,也为进一步分析选择、复杂突变机制和结构化种群提供必要基线。

已有研究虽然在可逆父本无关突变(parent-independent mutation, PIM)情形下提示了Dirichlet型结构的重要性,但群体遗传学文献中较少直接针对“带标签的等位基因计数向量”给出有限n下Dirichlet–multinomial平稳分布的清晰构造。另一方面,统计物理与社会动力学中的投票者模型(voter model)已知与双等位基因Moran过程存在精确对应,但这一对应尚未系统推广到任意多等位基因、多候选人的一般情形。基于此,本文开展研究的必要性在于:一方面需要得到多等位基因Moran过程的精确有限种群平稳分布与临界多样性阈值;另一方面需要理解当种群不再是充分混合、而是嵌入随机网络或结构化网络时,网络拓扑将如何改变平稳遗传多样性。

研究人员首先将具有顽固者(zealots)的充分混合多候选人投票者模型形式化,给出自由投票者计数向量在状态单纯形上的马尔可夫链表示,并通过细致平衡(detailed balance)直接证明其平稳分布为Dirichlet–multinomial分布。当所有候选人的顽固者参数均为1时,平稳分布在整个计数单纯形上为均匀分布,这一情形定义了系统由“单一类型优势”向“更均匀共存”过渡的临界点。随后,研究人员构建多等位基因Moran模型,假设突变满足PIM,即突变概率仅依赖目标等位基因而与亲本等位基因无关。在这一条件下,研究人员精确推导出Moran跃迁核与多候选人投票者模型跃迁核之间的参数映射,进而证明二者的平稳分布严格一致。由此得到多等位基因Moran过程在有限n和任意m下的显式平稳分布,并给出临界突变率
uc=1/(2n?2+m)。
这一结果将双等位基因情况下的uc=1/(2n)自然推广到多等位基因情形,并明确展示了临界阈值对等位基因数m的依赖关系。

在网络扩展方面,研究人员分别分析了投票者模型和Moran模型在Erd?s–Rényi(ER)随机网络中的表现。对于投票者模型,在“自由节点之间局域连接、顽固者对所有自由节点保持全局影响”的设定下,ER均值场近似表明,稀疏随机连接会通过一个与平均度d相关的放大因子增强顽固者影响,因此其平稳票数分布可写为带有效参数的Dirichlet–multinomial形式。与此不同,Moran模型在ER网络中的局域交配限制,经均值场闭合后,所诱导出的等位基因计数动力学虽然也可映射到投票者模型,但最终平稳分布中的有效参数恰好恢复为充分混合情形对应的形式,因此平稳等位基因分布及其临界突变阈值对ER网络平均度d不敏感。这一结果说明,在同质随机网络上,局域连接会影响局部混合与时间尺度,但不会在均值场层面改变中性突变—漂变平衡所决定的长期多样性格局。

为检验理论预测的稳健性,研究人员进一步在多种网络拓扑上进行模拟,包括ER网络、Barabási–Albert无标度网络、环形网络以及小世界网络。模拟结果显示,在所考察的所有拓扑上,Moran模型与对应投票者模型的平稳分布高度一致,表明二者对应关系可能超出ER均值场适用范围而具有更广泛适用性。但与此同时,网络结构对平稳多样性本身具有显著塑形作用。ER网络基本支持理论预测;无标度网络因度异质性增强了枢纽节点的影响,使分布相对充分混合基线偏向较低多样性,并使表观临界突变率上移;环形网络则因空间局域性与非交换性增强了不同区域长期分化,使系统在较低突变率下仍能维持较高多样性,表现为表观临界突变率下移;小世界网络则展示了从局域空间结构向随机混合结构逐渐过渡时,平稳分布如何连续接近ER/充分混合基线。

从理论意义看,本文最重要的贡献是将多等位基因Moran过程的平稳问题转化为多候选人投票者模型问题,并在有限种群尺度上导出精确的Dirichlet–multinomial平稳律。这一框架不仅统一了群体遗传学、统计物理和网络科学中的两类经典随机过程,也为中性条件下的等位基因计数数据分析提供了明确基准。研究表明,哪些平稳性质对同质随机连接具有鲁棒性,哪些则对度异质性与空间局域性高度敏感,从而为理解真实结构化种群中的遗传多样性形成机制提供了更细化的定量预期。

就主要方法而言,本文首先基于马尔可夫链与细致平衡方法,推导充分混合多候选人投票者模型的Dirichlet–multinomial平稳分布;随后通过构造多等位基因Moran过程与投票者模型之间的精确参数映射,导出Moran模型的平稳分布与临界突变阈值;在网络部分,采用Erd?s–Rényi网络上的均值场(mean-field)随机邻域近似及其二阶校正处理度波动效应;最后在ER、无标度、环形和小世界网络上进行大规模数值模拟,对理论预测与拓扑偏离进行比较。本文未使用外部样本队列,全部证据来自解析推导与模拟实验。

2. The voter model with zealots on fully mixed populations
本节首先回顾双候选人、充分混合且含顽固者的投票者模型,并用适用于后续推广的方式重新证明其平稳分布。研究显示,该模型的状态可由支持候选人1的自由投票者数唯一表征,其平稳分布可写为Beta-binomial形式;在双候选人情形下,这正是Dirichlet–multinomial分布的特例。当两类顽固者数均为1时,平稳分布严格均匀,构成二元系统的临界点。

2.1. Two candidates
研究人员通过细致平衡验证了双候选人模型的平稳分布,证明其不依赖保留概率?,而仅由复制核Q决定。该部分的关键意义在于建立统一记号与跃迁写法,为后续以向量计数形式推广到多候选人与多等位基因模型奠定基础。

2.2. Multiple candidates
这是全文的核心新贡献之一。研究人员将双候选人模型推广到m个候选人,令系统状态由自由投票者计数向量Xt=(Xt,1,?,Xt,m)表示,并证明其唯一平稳分布为Dirichlet–multinomial分布。若所有顽固者参数αi=1,则该分布在状态空间Sn上为均匀分布。进一步,当n趋于无穷时,频率向量收敛到Dirichlet分布。这部分结果说明,多候选人投票者模型本身就具有清晰的可积结构,可直接作为多等位基因Moran模型的解析参照。

2.3. Multiple candidates on random populations under global zealot influence
研究人员将多候选人投票者模型扩展至ER随机网络,其中自由节点之间按ER图连接,而顽固者对所有自由节点施加全局影响。通过ER均值场近似,局域邻域组成被全局频率的无偏抽样所替代,进而得到平稳分布仍为Dirichlet–multinomial,但顽固者参数被重新缩放为有效参数αieff。结论表明,在稀疏随机网络上,顽固者影响会按(n?1)/d因子被放大,这一结论为后续ER网络上的Moran分析提供了桥梁。

3. The Moran model on fully mixed populations
本节构建具有m个等位基因、满足PIM的充分混合Moran模型,并证明其与多候选人投票者模型之间存在精确对应。研究人员首先将Moran更新写成便于与投票者模型比较的“焦点个体—第二亲本—后代继承与突变”形式,再计算由j型变为i型的单步跃迁概率。利用PIM结构,跃迁概率被化简为与当前i型计数线性相关的形式,从而可与投票者模型中的“复制+顽固者驱动”核精确匹配。由此得到参数映射
αi=2(n?1)ui/(1?Λ)。
最终结论是:Moran模型的平稳等位基因计数分布正是Dirichlet–multinomial分布,且临界突变率为
uc=1/(2n?2+m)。
这一步将多等位基因有限种群中性模型的平稳律显式化,并把临界多样性阈值与等位基因数、种群规模统一联系起来。

4. Moran model on random populations
本节分析ER网络上的多等位基因Moran模型。研究人员假设交配仅发生在焦点个体的网络邻居之间,并在ER随机邻域近似下,将邻域等位基因组成以全局计数频率近似。推导表明,该模型诱导的计数跃迁核与充分混合投票者模型完全同型,因此平稳分布仍为Dirichlet–multinomial,且其参数最终与充分混合Moran模型相同,不依赖平均度d。由此说明,在ER均值场层面,随机稀疏性不会改变多等位基因中性Moran过程的长期等位基因计数分布,也不会改变临界突变率。

5. Summary of Results
研究人员系统汇总了解析结果:充分混合多候选人投票者模型的平稳分布为Dirichlet–multinomial;ER网络上的投票者模型具有经缩放的有效顽固者参数;充分混合与ER网络上的多等位基因Moran模型具有相同的Dirichlet–multinomial平稳律;临界突变率统一为uc=1/(2n?2+m)。这一节强化了全文的理论主线,即“投票者模型—Moran过程—网络结构”三者可在统一框架内刻画。

6. Simulations
本节通过三等位基因/三候选人设定,对理论进行数值验证。
在充分混合基线下,模拟分布与精确Dirichlet–multinomial分布高度一致,验证了解析推导。
在ER网络上,Moran模型与投票者模型的平稳分布几乎重合,且与均值场预测吻合,支持“ER稀疏性不改变Moran平稳分布”的结论。
在无标度网络上,尽管Moran—投票者对应依然近似成立,但度异质性导致分布向低多样性偏移,均值场临界点不再准确;引入考虑度波动的二阶修正后,理论与模拟符合度显著提升。
在环形网络上,局域空间结构显著增强多样性,低突变率下分布仍集中于单纯形中心附近,说明表观临界突变率低于充分混合情形;当环的度增加时,这种空间效应减弱,但仍可观察到与充分混合不同的边缘概率特征。
在小世界网络上,随着重连概率增加,平稳分布逐步逼近ER均值场结果,但在临界突变附近需要较高重连水平才能接近理论均匀分布。
这些模拟说明:虽然Moran—投票者映射在多种网络拓扑上都表现出很强稳健性,但平稳多样性的具体形状对拓扑性质极其敏感。

7. Discussion
讨论部分强调,本文结果应被理解为多等位基因中性有限种群模型在PIM条件下的解析基线。PIM虽然不是最一般的突变机制,但它既与经典Jukes–Cantor型对称思想相容,又能够保留足够的生物学解释性和数学可处理性。研究人员指出,所得到的Dirichlet–multinomial平稳律可作为在中性假设下拟合等位基因计数数据、估计突变参数以及识别偏离中性的参考标准。

关于结构效应,讨论部分总结出清晰图景:同质随机连接在ER均值场下并不改变长期等位基因计数分布;度异质性倾向于降低中性多样性,可能与高连接节点带来的谱系影响放大有关;空间局域性则倾向于提高多样性,使不同区域更长时间保持差异;小世界拓扑则表现出从局域结构向随机混合过渡的连续性。研究人员同时指出,任意网络上的精确平稳分布未必仍具有Dirichlet–multinomial形式,何时能够用简单降维描述准确刻画结构化种群的长期行为,仍是值得进一步研究的重要问题。

研究结论部分可译为:更广泛地说,本研究在中性条件下提供了一个精确的多等位基因平稳分布,并在两类经典随机过程——Moran模型与投票者模型——之间建立了严格桥梁。这一联系使得工具与直觉能够在群体遗传学、统计物理学和网络科学之间迁移,并为解释结构化种群中的等位基因计数数据提供了有原则的基线。通过阐明平稳分布中哪些特征具有普适性,即对同质随机连通性具有稳健性,以及哪些特征依赖拓扑,即对异质性与空间局域性敏感,本文结果有助于提高对现实相互作用结构下遗传多样性的定量预期。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号