编辑推荐:
为解决多尺度人体器官三维结构数据的获取、共享与利用难题,推动生物医学研究和医学教育,欧洲同步辐射光源(ESRF)等机构的科研人员开发了“人类器官图谱(HOA)”。这是一个基于同步辐射分层相衬断层扫描(HiP-CT)技术构建的开放数据平台,提供了从整体器官到细胞水平的跨尺度三维影像数据,并配备了软件工具和训练资源。该平台目前已收录了来自24位捐赠者、10种器官的298个三维图像数据集,数据遵循FAIR原则开放共享。HOA为医学解剖可视化、疾病机制研究(如COVID-19、高血压、癌症)、以及机器学习和人工智能在生物医学影像分析领域的应用(如超分辨率分割、三维分割、自监督基础模型训练等)提供了独特且宝贵的研究资源,有望在精准医疗、医学教育和生物医学数据挖掘方面产生深远影响。
人体是一个由器官、组织、细胞和细胞外基质构成的精密、多层次的三维(3D)机器。理解其结构是理解功能、健康和疾病的基础。长久以来,科学家们一直梦想绘制人体在细胞和组织水平上的完整图谱,其中三维成像技术是关键工具。然而,传统成像技术存在诸多限制:临床计算机断层扫描(CT)或离体磁共振成像(MRI)的分辨率有限,通常在百微米量级,无法解析许多精细的微观结构;而能提供高分辨率细节的组织切片染色技术虽然分辨率高,但需要对组织进行物理切割,破坏了样本的完整性和三维空间信息,且过程繁琐耗时。此外,即便有了先进技术,生成的高分辨率三维影像数据往往体积庞大,难以共享和使用,导致宝贵的科研数据无法被更广泛的科学界充分利用,阻碍了科学发现的步伐。
为了应对这些挑战,一个国际研究团队在《SCIENCE ADVANCES》杂志上报告了他们构建的“人类器官图谱”。这项研究旨在创建一个开放获取、易于使用、包含多层次三维人体器官影像的数据资源库,以弥合高分辨率成像技术与全球科研、教育和临床需求之间的鸿沟。该平台基于欧洲同步辐射光源(ESRF)开发的创新成像技术——分层相衬断层扫描(HiP-CT),能够对完整的离体人体器官进行成像,其成像尺度跨越了从整个器官(约20微米/体素)到局部感兴趣区域(可低至约1微米/体素)的多个层次,为深入探索从器官到亚细胞水平的人体解剖结构提供了前所未有的可能。该研究不仅介绍了数据平台的构建,还展示了其在机器学习驱动的结构定量化和解剖学可视化教育等领域的应用潜力,标志着一个开放、协作的生物医学研究新时代的到来。
为了开展这项研究,团队主要运用了几项关键技术。首先是分层相衬断层扫描技术,该技术利用ESRF的极亮光源,对离体人体器官进行同步辐射X射线成像,生成跨尺度的三维图像数据。样本来源于汉诺威统一生物样本库、法国阿尔卑斯解剖实验室等欧洲生物样本库。其次,团队构建了人类器官图谱数据门户,这是一个基于Web的开放平台,集成了数据管理、可视化与分析工具,确保数据遵循“可发现、可访问、可互操作、可重用”的原则。数据采用JPEG2000格式存储和压缩,并提供了从原始数据到多种下采样版本的数据下载选项。此外,通过神经胶质浏览器,用户无需安装任何额外软件即可在网页浏览器中直接交互式浏览庞大的三维数据集。最后,研究采用了数据配准与标准化元数据流程,将高分辨率的局部扫描数据与整体器官扫描数据进行刚性配准,形成层级数据集,并为每个数据集提供了包含扫描参数、供体信息、医学历史等在内的标准化元数据文件,以支持数据的可重复分析和跨研究比较。
HOA的特点与组织结构
人类器官图谱门户网站(网址:human-organ-atlas.esrf.eu)旨在最大化HiP-CT数据的效用。其核心是确保数据的FAIR性。为了实现数据的“可发现”,网站提供了“探索”和“搜索”选项卡,用户可按器官、供体或详细的元数据来查找数据集。“可访问性”体现在每个数据集页面都提供通过Globus系统下载的数据,并提供不同下采样级别的版本,使计算资源有限的用户也能使用。“可互操作性”通过为每个数据集提供遵循严格模式的JSON格式元数据文件来实现,这些元数据涵盖了数据本身、扫描参数、供体信息、样本制备、图像配准变换和归属数据等六大类别。而基于神经胶质浏览器的在线三维可视化工具,则让全球用户无需下载即可快速评估数据质量、识别感兴趣的特征,这极大地促进了数据的“可重用性”。此外,平台还提供了使用教程和帮助页面,以及一个名为“hoa-tools”的Python工具包,以支持更高级的数据处理。
HOA中现有的数据
截至目前,HOA包含来自24位个体捐赠者的298个三维图像,涵盖了大脑、结肠、心脏、肾脏、肝脏、肺、前列腺、脾脏、睾丸和子宫这10种器官。捐赠者平均年龄为73岁,反映了现有数据更偏向于老年人群。值得注意的是,平台有意采集并整理了来自同一位捐赠者的多个器官数据,例如捐赠者LADAF-2021-17就提供了9种器官的数据,这为研究多系统疾病(如高血压对不同器官的影响)提供了独特机会。数据集中包含了多种与年龄相关的病理,如高血压和癌症,以及相当比例的COVID-19病例,这为研究当今全球北方地区的主要致死疾病以及丹迪-沃克综合征等罕见病提供了丰富的影像数据库。
在机器学习结构定量化中的应用
HOA的一个关键应用是为生物医学机器学习社区提供经过整理的3D分层成像数据集。其数据的各向同性和层级对齐特性,为监督、半监督和无监督学习提供了多种可能性。研究人员可以:1)利用单一分辨率的各向同性数据进行3D结构分割;2)利用层级对齐数据进行超分辨率应用;3)利用大量整理好的3D数据训练自监督基础模型。研究以人类肾脏的肾小球分割为例,展示了如何利用层级数据集进行“超分辨率分割”。具体而言,在最高分辨率下(1.29 微米/体素)可以精确分割肾小球,然后将这些分割结果作为伪标签,通过机器学习模型(如nn-UNet)传播到较低分辨率的整体器官图像中,从而在从未被详细探索过的尺度上绘制出整个器官内微小功能单元的空间分布图。
在解剖学可视化和医学教育中的应用
HOA的数据集在体素尺寸上比临床CT或离体MRI精细一到两个数量级,并且与需要切片的全器官光片显微镜不同,它能提供各向同性的体素且不破坏样本完整性。这种多尺度特性使其成为解剖学教育和研究的宝贵工具。平台数据可以用于可视化诸如心脏瓣膜、肾脏血管系统等复杂三维结构。结合3D高斯溅射等先进渲染技术,可以实现对三维解剖数据的实时交互操作(如旋转、缩放),这将有助于医学生更直观地理解复杂解剖结构之间的空间关系,从而在下一代解剖学教育应用中扮演核心角色。
研究结论与讨论
人类器官图谱是一个高度独特的资源,它汇集了来自多位捐赠者、多种器官的多分辨率影像数据集,并提供了元数据、在线可视化工具和使用教程。该平台为探索从整个器官到器官功能单元甚至某些细胞结构的人体解剖提供了全面视角,为解剖学研究、图像分析、医学教育和大规模数据挖掘提供了宝贵资源。通过以用户友好的界面、可搜索的数据库和不断增长的数据集提供FAIR数据访问,HOA旨在向更广泛的科学界开放其数据和成像技术,推动科学家们跨学科地增进对人类健康和医学领域的理解、诊断和治疗。
当然,使用HOA数据也需注意其局限性。由于是离体成像,器官制备过程中的收缩以及大型腔室(如心脏左心房)的塌陷是普遍存在的,血管也常处于塌陷状态,这为血管注释带来了挑战。此外,现有数据在捐赠者年龄和性别多样性上存在偏差。未来,HOA项目将继续收集和发布数据,以扩大数据的多样性、质量和规模。一个围绕HOA和HiP-CT成像技术的联盟——人类器官图谱中心已经成立,将继续推进自动化分析方法、多模态流程和基于图像的动态建模等工作。同时,平台计划提供更多衍生数据集、改进教程和工具,并使元数据与社区采用的元数据本体论互操作。总而言之,HOA的建立和开放,标志着在构建开放、协作、数据驱动的新型生物医学研究生态方面迈出了关键一步。