**Lassa virus在西非的公开基因组数据可及性:序列可获得性、生态风险与监测空白的绘制**

《Cogent Public Health》:Public genomic visibility of Lassa virus in West Africa: mapping sequence availability, ecological risk, and surveillance gaps

【字体: 时间:2026年05月28日 来源:Cogent Public Health

编辑推荐:

  **摘要** **引言** 拉沙热(Lassa fever)是西非一种主要的动物源性感染,但其真实流行病学仍难以明确界定,因为各国的诊断可及性、报告系统和监测能力存在差异。尽管已有大量研究考察了拉沙病毒(LASV)的生态学、流行病学、诊断

  
**摘要** **引言** 拉沙热(Lassa fever)是西非一种主要的动物源性感染,但其真实流行病学仍难以明确界定,因为各国的诊断可及性、报告系统和监测能力存在差异。尽管已有大量研究考察了拉沙病毒(LASV)的生态学、流行病学、诊断和暴发应对,但对于区域疾病负担/风险证据如何与公开可见的基因组数据相符,仍知之甚少。**理论** 本研究区分了LASV的传播风险与公开基因组可见性,将序列可获得性视为生态学、实验室系统、生物信息学能力、治理、研究伙伴关系和持续融资的产物。**方法** 从美国国家生物技术信息中心(NCBI)核苷酸数据库检索公共LASV序列元数据,并在16个西非国家间进行总结。各国根据序列可见性、负担/风险证据、生态背景和公开基因组监测空白类别进行分类。引入CHIRPS降雨数据作为背景生态描述指标。一项对31项研究的系统性综述识别了LASV基因组监测的结构、技术和政策障碍。**结果** 在16个国家中的9个国家识别出公共LASV序列,共计1818条经验证的记录。序列可见性高度集中:尼日利亚占所有记录的71.3%,而尼日利亚、塞拉利昂、几内亚和利比里亚四国占94.3%。七个尽管有记录的、可能的或生态学上合理的风险的国家,却没有任何公开可识别的序列。**讨论** 公开的LASV基因组可见性并不能反映更广泛的区域风险格局。加强监测需要将整合的基因组系统与诊断、“同一健康”(One Health)监测、本地生物信息学能力、公平的数据共享以及可持续的长期投资联系起来。
拉沙病毒(Lassa mammarenavirus, LASV)在西非造成的公共卫生负担日益受到关注,但其流行病学图景仍存在诸多不确定性。这种不确定性不仅源于病毒本身的生态复杂性,更与各国诊断能力、监测体系和数据共享机制的差异密切相关。公开可及的基因组数据本应是理解病毒传播和多样性的基石,然而其分布却极不均衡,这可能掩盖了真实的风险分布,并阻碍有效的区域联防联控。因此,一项旨在系统评估西非地区LASV公开基因组数据可见性、并探究其与已知风险、生态背景及监测系统障碍之间关系的研究显得尤为必要。本研究的核心目标是绘制LASV基因组序列在公共数据库中的可获得性图谱,识别那些存在已记录或潜在风险但公开基因组数据缺失的监测空白区域,并综合分析造成这种“可见性鸿沟”的结构性因素。

为了达成上述目标,研究人员采用了定量映射与定性综述相结合的混合方法设计。在定量部分,研究团队对16个西非国家进行了国家层面的监测映射分析。数据主要来源于NCBI核苷酸数据库,通过编程检索获取了截至特定日期的公共LASV序列元数据。研究人员从原始记录中提取了关键信息,如序列号、来源国家、收集日期、宿主类型和序列长度等,并据此计算了每个国家的序列数量、时间跨度等指标。根据这些指标,各国被分为无序列、低可见性(1-9条)、中等可见性(10-99条)和高可见性(≥100条)四个组别。同时,研究人员从同行评议文献、公共卫生报告和灰色文献中手工汇编了各国的疾病负担/风险证据,将其分类为“有记录/高风险”、“可能/潜在风险”和“有限的公共证据”三类。通过对比风险分类与序列可见性,研究划分了潜在的基因组监测空白类别。此外,研究引入了2000-2024年CHIRPS(气候危害组红外降水与站点数据)的月均降雨量、降雨变异系数等数据,作为生态背景描述指标,并分析了国境接壤、宿主证据等地理因素。所有定量分析均使用R语言(版本4.5.2)进行描述性统计和探索性关联分析。定性部分则开展了一项系统性文献综述,以识别LASV基因组监测的障碍。研究团队在PubMed、Scopus等多个英文数据库中检索了2000年1月至2026年3月间发表的相关文献,最终筛选出31项研究纳入定性证据基础。通过系统性地提取数据,研究人员围绕从病例识别、样本转运到测序、生物信息学分析、数据治理和公共数据存档的整个监测路径,对识别出的障碍进行了叙述性综合。研究样本主要来源于公开数据库和已发表文献,分析单元为国家。

研究结果揭示了西非地区LASV公开基因组数据可见性的严重失衡与结构性缺口。定量分析显示,在16个研究国家中,仅有9个国家在公共数据库中拥有LASV序列记录,总计1818条经验证的序列。这种分布高度集中:仅尼日利亚一国就贡献了71.3%的记录,而尼日利亚、塞拉利昂、几内亚和利比里亚这四个国家合计占据了94.3%的区域总序列。其余五个有任何序列的国家贡献不足6%。时间维度上,尼日利亚的序列记录跨度最长(1969-2022年),而许多序列稀少的国家其数据时间覆盖也相应有限。在生态与地理背景分析中,国家间的平均月降雨量差异巨大,从毛里塔尼亚的8.5毫米/月到塞拉利昂的211.7毫米/月。探索性相关性分析发现,国家层面的序列数量与平均月降雨量呈显著正相关(ρ = 0.69, p = 0.004),与降雨变异系数呈负相关(ρ = -0.67, p = 0.006),这暗示着生态适宜性较高的沿海国家可能具有更强的序列生成能力,但这种关联更多是背景性的,而非直接的因果关系。国境接壤情况并未显示出与序列存在的明确统计关联,表明地理邻近性并不能自动转化为监测可见性。在疾病负担/风险分类方面,9个国家被划为“有记录/高风险”,其中包括尼日利亚等四个证据最强的国家,以及贝宁、科特迪瓦等五个有中等强度证据的国家。布基纳法索、几内亚比绍等四国被列为“可能/潜在风险”,而佛得角等三国则被归为“有限证据”。对比可见,多个被认定为存在生态学合理性或潜在风险的国家(如布基纳法索、几内亚比绍、尼日尔、塞内加尔)在公开数据库中却无任何序列,构成了显著的“公开基因组监测空白”。

定性综合部分系统性地揭示了造成上述失衡的深层障碍。纳入的31项研究从流行病学、诊断与基因组学、生态驱动因素、卫生系统以及预测建模等多个维度提供了证据。流行病学和风险制图研究证实了LASV风险在地理上的异质性及其超出传统热点区域的潜力,但同时指出采样和数据不均衡会扭曲风险评估。诊断与实验室监测文献表明,尽管检测和测序工具已存在,但其应用极不均衡,普遍存在的障碍包括LASV遗传多样性导致的检测方法性能差异、对中心化实验室的依赖、冷链物流和样本处理能力有限、试剂和设备成本高昂、测序投入不足以及生物信息学与数据治理体系薄弱。生态与“同一健康”研究强调有效监测需要整合人类、动物和环境数据,但目前这种整合性采样大多局限于独立的研究项目,而非常规国家系统,且对啮齿动物宿主的系统性基因组采样尤为缺乏。卫生系统与政策分析揭示了一系列最持续存在的障碍:诊断覆盖率有限、样本转运能力不足、实验室生物安全水平低下、训练有素的人员短缺、资金依赖项目或暴发驱动而非可持续投入、治理结构碎片化、数据共享政策不一致以及跨境协调有限。预测建模研究虽然展示了数据驱动方法在LASV预测中的应用潜力,但其效能严重依赖于完整、及时且具有地理代表性的数据,而这恰恰是当前监测体系的弱点。将这些发现综合起来,研究人员识别出五个反复出现的障碍领域,贯穿整个监测路径:1) 实验室与诊断基础设施受限;2) 样本采集与转运系统不完善;3) 工作人员与分析能力不足;4) 数据治理与区域协调不力;5) 监测投资可持续性差。

讨论部分对研究发现进行了深入阐释。研究的核心贡献在于概念层面:它指出拉沙热的疾病负担与生态学合理性并不等同于公开基因组可见性,而两者间的鸿沟是结构性的,而非偶然的。公共序列档案不仅反映了病毒的生态分布,更反映了研究能力地理分布和数据共享系统的强弱。序列集中于少数国家,可能会产生系统性偏差,使公共档案更像是一张“测序系统成熟度图”而非“病毒多样性分布图”,这会导致系统发育地理推断错误、低估跨境传播联系并忽视谱系多样性。这种偏差还会反作用于监测系统本身:不完整的区域基因组档案可能使具有诊断抗性的变异谱系未被识别,从而影响监测系统的准确性。降雨信号的发现具有生态学合理性,但应视为背景而非传输确认。研究强调,单纯依靠地理邻近或生态适宜性无法自动纠正监测不平等。定性综合的最大价值在于揭示了主要制约因素分布在整个监测链条的各个环节,这说明挑战并非简单的“测序仪缺口”,而是测序仪周边支撑体系的脆弱性。但研究也指出,这种脆弱性并非固定不变。西非国家在应对COVID-19大流行期间积累的测序能力,有可能被重新整合并导向LASV等烈性传染病监测,例如非洲疾病预防控制中心(Africa CDC)的病原体基因组学计划(Pathogen Genomics Initiative)等区域性倡议,正致力于将应急投资转化为更持久的多病原体监测生态系统。因此,政策启示非常明确:投资不应局限于购买硬件设备或开展一次性暴发测序,而必须构建一个端到端的监测架构,将发热性疾病监测、病毒性出血热诊断、宿主与环境监测、样本转运、国内分析以及带有可用元数据的基因组常规存档整合起来。对于LASV这类罕见但高危的病原体,“中心-辐射”式的测序模式或许是务实之选,但必须配套明确的署名权、标准化的元数据和可信的惠益分享安排,否则,数据可能在操作层面生成,却无法在区域层面实现可见。研究也承认了一些局限性,例如公共数据库的缺失可能低估了总监测活动量,生态分析基于国家层面无法解析国内热点,以及定性证据基础受限于英文文献等。尽管如此,核心结论是稳健的:西非LASV区域问题的核心不仅仅是测序不足,更是那些最需要共享基因组数据以提升跨境应对能力的地区,在公开基因组智能系统中“可见性”不足。

**研究结论**:本研究表明,西非地区公开的LASV基因组可见性仍然高度不均,且仅部分与已知或潜在的拉沙热负担相符。研究结果指出,该区域的问题不仅是测序缺失,更是将疑似传播、诊断确认和基因组分析转化为具有可用元数据的公开可及序列数据的能力有限。因此,公共数据库不仅反映了病毒生态,也反映了监测系统强度、样本转运网络、生物信息学能力、数据治理、合作协议以及可持续融资的水平。这一区分至关重要,因为公开LASV序列稀少或缺失的国家仍可能存在生态风险、人类暴露或未记录的监测活动,但在区域基因组智能系统中很大程度上仍不可见。LASV基因组监测应作为西非病毒性出血热监测的常规组成部分,而非被视为偶发性研究产出或仅在暴发时开展的活动。区域和国家投资应优先用于构建连接病例检测、诊断确认、样本转运、国内或区域协调测序、生物信息学、元数据整理以及及时公共数据共享的端到端系统。仅靠硬件购置无法弥合可见性鸿沟。可持续的进展将需要明确的数据共享政策、公平的合作协议、本地分析所有权、“同一健康”采样以及长期融资。若不进行这些变革,该地区将继续面临碎片化的公共基因组记录,从而限制对拉沙热的谱系追踪、诊断验证、跨境应对准备以及共享态势感知能力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号