编辑推荐:
本文推荐构建了首个全面的鱼类红细胞(RBC/erythrocyte)尺寸开源数据库ErythroCite。该研究通过系统性制图方法整合了来自660个鱼种、4个主要谱系(辐鳍鱼纲、软骨鱼纲、肺鱼纲、圆口纲)的1764条细胞尺寸记录,揭示了细胞体积高达414倍的惊人变异范围。ErythroCite不仅收录了细胞与细胞核的面积、体积等形态计量数据,还整合了系统发育、生物学特征和生态学信息。该数据库有望为宏生态学、宏观生理学、比较生理学、进化生物学和细胞生物学研究提供关键数据支持,推动对红细胞多样性和功能的深入探索,并检验关于细胞尺寸与生物代谢关系的“最优细胞尺寸”理论。
ErythroCite:一个全面的鱼类红细胞尺寸数据库
摘要
尺寸是生物学中的一个基本性状,细胞尺寸在细胞功能中起着关键作用,影响着生物体的生理适应和进化过程。科学家们数十年来一直对动物细胞尺寸的巨大变异感到着迷,但系统性地汇编此类数据的努力却很少。为了填补这一空白,研究者采用系统性制图方法创建了ErythroCite,这是一个关于鱼类红细胞尺寸的开源数据库。这一综合性资源涵盖了来自四个主要谱系(辐鳍鱼纲、软骨鱼纲、肺鱼纲、圆口纲)660个物种的1764条记录。研究结果揭示了细胞体积高达414倍的显著变异范围,其中大多数研究集中在硬骨鱼类,而关于幼体和早期生活阶段的数据有限。生活史阶段和性别信息不常被报告,但现有数据显示雌雄成年个体的代表性相当。ErythroCite为宏生态学、宏观生理学、比较生理学、进化生物学和细胞生物学的研究提供了宝贵的见解。研究者预期这一资源将促进比较研究和荟萃分析,在全球范围内推动对鱼类红细胞多样性和功能的进一步探索。
引言
尺寸因其对生命功能的深刻影响而在生物学中扮演着关键角色。数个世纪以来,科学家们一直对生物体间尺寸相关变异的因果感兴趣。虽然大部分兴趣集中在整体体型上,但对细胞特征的探索可以追溯到1675年,当时首次描述了人类红细胞。两个世纪后的1875年,乔治·古利弗的插图揭示了脊椎动物血细胞尺寸的显著变异。古利弗的工作增强了对动物界红细胞多样性的理解,特别是关于与红细胞尺寸变异相关的特征。
在大多数脊椎动物中,红细胞是主要的血细胞类型和最丰富的细胞成分,在新陈代谢生理学中发挥着核心作用。它们的功能主要源于血红蛋白,这是一种特殊的氧和二氧化碳结合蛋白,促进了氧气从呼吸器官到组织的生理运输过程。此外,红细胞特征提供了关于物种如何适应不同环境条件的生理洞察。最近的研究表明,细胞尺寸显著影响变温物种对周围温度升高的反应。此外,研究表明不同器官和组织间的细胞尺寸存在相互关联。这种系统性关系将红细胞尺寸定位为一个简单而有用的指标,用于评估整个生物体的细胞尺寸。然而,尽管细胞尺寸在单物种研究和针对其他脊椎动物类群的多物种比较中很重要,但目前还没有关于不同物种间红细胞特征的全面、最新的数据库。
为了填补这一知识空白,研究者开发了ErythroCite,这是迄今为止最广泛的细胞尺寸相关性状数据库,包含了660种鱼类的数据。ErythroCite不仅仅是对血细胞尺寸的编目,它还整合了四个鱼类谱系的系统发育关系、生物学性状和生态学信息。选择鱼类作为起点有几个原因。首先,鱼类约占所有脊椎动物物种的50%,有超过35,000个已描述物种。它们的红细胞呈独特的椭圆形、扁平、双凸形状。与哺乳动物去核的红细胞不同,这些有核细胞为其他变温脊椎动物(如两栖动物和爬行动物)的进化适应提供了宝贵的见解。其次,虽然水生生物和高海拔陆地脊椎动物都面临氧气限制,但水生物种,如鱼类,更频繁地暴露于低氧和波动的氧气条件下。因此,它们的气体运输系统——包括红细胞的特性——必须有效运作以确保氧气输送到组织。第三,鱼类性状数据库的可获得性使得ErythroCite可以与其他数据集整合,增强我们对影响细胞尺寸变异因素的理解。最后,建立鱼类红细胞数据库对于增强和更新现有举措(如动物基因组大小数据库)是必要的,这应通过系统性的、多语言的文献综述和数据收集方法来实现。
研究者期望ErythroCite能帮助研究人员进行更稳健的比较分析,并调查各种鱼类红细胞尺寸的适应意义,从而促进对其进化重要性的更深入理解。特别是,研究者预计这个数据库的创建将加强当前的“最优细胞尺寸”理论,该理论将细胞尺寸与生物体的新陈代谢联系起来。
方法
研究者遵循Nakagawa等人建立的MeRIT指南,以确保方法和报告描述的清晰度和透明度。这些指南在方法部分使用作者姓名首字母来将特定任务归因于个体贡献者,补充了贡献者角色分类系统。
文献检索
目标是汇编关于鱼类红细胞细胞形态学的综合数据。具体来说,识别了量化细胞面积和体积、以及细胞核面积和体积等参数的研究。此外,为每个条目和物种收集了相关的地理、生物学和生态学元数据,并为该主题的文献制图收集了每项研究的文献计量信息。
信息检索由FPLeiva使用三个搜索引擎进行:ISI Web of Science(核心合集)、Scopus和Google Scholar。前两个搜索引擎专门用于2024年7月12日的英文检索,利用了Radboud大学对这些服务的订阅。使用的布尔检索词组合是:(红细胞* OR 红细胞 OR RBC OR 血细胞 OR 红色血球)AND (面积 OR 尺寸 OR 维度 OR 体积 OR 直径 OR 形态)AND (鱼 OR 硬骨鱼 OR 鲨鱼* OR 鳐鱼* OR 鳐 OR 银鲛 OR 鬼鲨 OR 水生脊椎动物 OR 软骨鱼纲 OR 硬骨鱼纲 OR 辐鳍鱼* OR 硬骨鱼*)。从这些检索中,下载了所有年份、版本和文献类型的完整记录,包括摘要、关键词和所有相关信息。使用ISI Web of Science,共识别出4,341条记录,而在Scopus中,找到了1,039条记录。
Google Scholar检索于2024年7月22日至24日进行,目标语言为西班牙语、意大利语、葡萄牙语、德语、法语和波兰语。为了促进这种多语言检索,将英文关键词翻译成这六种语言。除了西班牙语(FPLeiva的母语)外,对其他所有语言都使用DeepL进行初步翻译。然后由母语人士验证翻译的准确性:CAFreire验证葡萄牙语,MShokri验证意大利语,KAlter验证德语,LSerre-Fredj验证法语,AHermaniuk验证波兰语。选择这些语言是为了优化纳入至少一位论文作者可以阅读的非英语研究。使用Publish or Perish软件检索和提取每种语言的记录。为了适应Google Scholar 256个字符的检索字符串限制,研究者修改了每种语言的初始布尔检索词。压缩了检索字符串,同时保留了研究问题的基本概念,确保尽管Google Scholar有限制,但所有目标语言的检索是全面的。
Google Scholar跨语言检索共产生3,599项研究。总共,多引擎、多语言检索产生了8,979条记录。随后,筛选这些记录以消除重复项,并根据标题、摘要和关键词评估其相关性。
除了系统性检索外,还采用了补充策略来改进文献检索。对于向后检索,研究者使用了动物基因组大小数据库的一个子集作为起点。此外,FPLeiva一直通过非系统性检索收集包括鱼类在内的各种变温动物类群的细胞尺寸信息。这项持续的努力为综述增加了九项研究。
为了简化筛选过程,研究者使用了Rayyan,这是一个基于人工智能的平台,旨在通过减少每个筛选步骤所需的时间来加速系统综述。筛选由具有语言专业知识的不同团队成员进行:FPLeiva处理西班牙语和英语记录,而CFreire筛选葡萄牙语研究。MShokri负责意大利语,KAlter负责德语,LSerre-Fredj负责法语,AHermaniuk负责波兰语研究。
资格标准
应用了以下纳入标准:(i)仅纳入原始研究文章,以确保原始数据和适当归功于原始来源;(ii)关注物种特异性数据以确保一致性和可比性,排除属级数据和杂交种;仅考虑测量成熟红细胞的研究,避免包括未成熟或发育中细胞的研究;(iii)选择研究二倍体生物的研究,排除多倍体,因为不同的染色体负荷可能导致细胞尺寸变异,尽管当多倍体的额外数据可用时,会以注释形式注明;(iv)在涉及各种处理的情况下,仅考虑报告了研究中标记的实验对照组条件的研究,以确保ErythroCite中研究结果的可比性;(v)对于少数在采血过程中使用抗凝剂的情况,使用平均细胞尺寸,因为抗凝剂会影响这些测量;(vi)当采用多种技术获取细胞尺寸时,优先考虑从血涂片获得的数据,因为与活细胞相比,它们提供了更一致的细胞尺寸测量,活细胞尺寸可能因其生理状态而异。使用这些纳入标准,ErythroCite在所有语言中纳入的研究数量为186项,这些研究都在此引用。
数据提取和元数据
研究者尽可能多地纳入原始研究中细胞面积、细胞体积、平均红细胞体积、细胞核面积和细胞核体积的直接估计值。然而,在许多研究中,仅报告了细胞及其细胞核的长轴和短轴长度。在这种情况下,研究者采用标准公式计算细胞或其细胞核的面积和体积,假设细胞及其细胞核形状为椭圆体或扁球体。
细胞面积(A)的公式为:
A = π × (a/2) × (b/2)
使用的细胞体积(V)公式为:
V = (4/3) × π × (a/2) × (b/2)2
其中‘a’和‘b’分别表示椭圆半长轴和半短轴的长度。这些参数用于前面的方程中,以计算模拟为椭圆形状的红细胞的面积(A)和体积(V)。
虽然大多数测量细胞体积的方法依赖于固定的血涂片,但也存在替代方法。各种研究报告了平均红细胞体积(MCV,以μm3为单位)作为细胞体积的替代指标。MCV通常使用标准公式估算。在数据库中,MCV值呈现在单独的列中,与从血涂片获得的细胞体积测量值进行比较时应谨慎解释。这种区分很重要,因为MCV源自血液学参数,而涂片测量值是通过直接显微镜观察获得的。此外,MCV代表整个红细胞群的平均值,而涂片的细胞体积估计值提供的是单个细胞的测量值。
尽管本工作纳入了大量研究,但与细胞尺寸估计相关的方法学信息(元数据)的收集相对有限。尽管如此,研究者收集了与采集物种来源地点、体型、性别和研究的生活史阶段相关的元数据。当地点描述笼统时,坐标从OpenStreetMap数据搜索引擎Nominatim获取。对于更具体的地点,例如命名的孵化场、研究所或地点,研究者使用谷歌地图确定精确的地理位置。此外,在额外的列中提供了动物来源地点的描述,这应用于筛选,例如,在用户有兴趣测试细胞尺寸变异的纬度假设时,筛选野外采集的动物。这是因为,例如,研究所地点不一定与该地区的自然栖息地条件相关。
研究者使用从FishBase获得的物种特异性体长-体重关系,将报告的以长度单位表示的鱼体尺寸转换为湿重(以克为单位)。有一项研究为15种鱼类提供了大约3700个观测值。对于这项研究,在个体水平(每个物种五个个体)平均了细胞尺寸。对于仅在图表中呈现细胞尺寸数据而未提供文本或表格信息的研究,研究者使用了Plot Digitizer,这是一个基于Java的程序,旨在从图表中提取X-Y坐标。
分类学和系统发育
检查了物种名称的同义词和可能影响分类学的任何更新。为此,研究者采用了Lenoir等人和Leiva等人概述的分类学统一程序。这种分类学统一包括三个自动化步骤:首先,在国家生物技术信息中心(NCBI)分类数据库中搜索物种名称;其次,使用综合分类信息系统(ITIS)数据库验证任何不匹配的分类实体;第三,将剩余的不匹配实体与全球生物多样性信息机构(GBIF)数据库进行交叉核对。如果找到匹配项,则在整个NCBI和ITIS验证过程中重新评估更正后的分类实体以确保准确分类。最终,数据库中仅保留物种级别的名称,亚种在物种级别聚合(例如,Catostomus catostomus)。大多数(91%)的物种名称验证来自NCBI,ITIS和GBIF提供了额外支持。对于无法通过此过程验证的剩余物种,使用FishBase和世界海洋物种名录(WoRMS)等额外资源进行了手动检查。在使用ITIS时,有几个物种被归入硬骨鱼纲,而GBIF将大多数物种未分配至任何纲。在这些情况下,研究者手动将这些物种重新分配到辐鳍鱼纲。为了解决数据互操作性的潜在问题,研究者还根据FishBase加入了物种的分类学。这将使用户更容易将细胞尺寸数据与其他鱼类性状结合起来,从而增强来自不同研究的数据集之间的互操作性。
研究者从开放生命之树(OTL)获取了物种的系统发育关系。对于OTL中缺乏信息的Choerodon albigena,研究者使用其姐妹种Choerodon cephalotes的系统发育位置添加了它。
研究者利用统一的物种列表,从FishBase获取每个物种相关的分布领域,于2024年11月14日通过WoRMS Taxon Match工具访问。在WoRMS中,淡水、咸淡水、海洋和陆地领域被分配为二元变量(1或0)。在数据库中,研究者记录了物种在其整个生命周期中是否占据一个以上的水生领域。此过程产生了五个类别:海洋、海洋-咸淡水-淡水、海洋-咸淡水、淡水-咸淡水和淡水,反映了物种占据的栖息地多样性,并认识到它们在整个生命周期中适应不同环境条件的能力。
所有分析均在R 4.3.1版本中进行。使用rutils、readxl、dplyr、plyr、writexl、tibble、sessioninfo、rnaturalearth、tidygeocoder、kableExtra和DataExplorer等R包来管理、格式化和检查数据。使用RefManageR包来管理和格式化参考文献。