《The Plant Phenome Journal》:Spatial analysis of cell patterning to aid genetic and phenotypic understanding of grass stomatal density: A case study in maize
编辑推荐:
本文介绍了一种创新的空间分析方法——气孔排布表型(SPP),用于分解气孔密度(SD)这一复合性状。通过分析玉米重组自交系的高通量表型数据,研究提取了细胞大小、间距和位置概率等核心组分性状,构建了结构方程模型,并定位了相关QTL。结果表明,SPP衍生的性状可解释74%的SD变异,为深入理解植物基因型-表型关系及作物水分利用效率(WUE)改良提供了新视角。
1 引言
生物过程具有复杂的层级结构,复合性状由多个组分性状共同决定。全面理解这些组分性状如何相互作用以支撑基因型到表型的关系仍然是一个普遍存在的挑战。气孔密度(SD)是一个易于研究的模型系统,可用于探索如何利用高通量表型(HTP)数据通过新的空间分析方法来更好地理解这一在发育和功能上均具重要意义的性状。SD是一个复合性状,源自与细胞身份和大小相关的各种组分,这些组分本身又受一系列时空发育过程的调控。
本研究利用一种新的气孔排布表型(SPP)方法,分析了192个玉米重组自交系(RIL)的数据。SPP方法旨在:(1)描述最近邻气孔的平均空间概率分布;(2)推导一组与细胞大小、细胞排列和位置概率相关的核心组分性状;(3)构建一个描述SD基础组分性状的结构方程模型(SEM);(4)识别气孔排布的数量性状位点(QTL)。研究结果表明,从SPP中提取的核心性状集合可以解释74%的SD变异。通过分析SPP组分性状,一些先前被鉴定为通用SD QTL的位点,可以被识别为对气孔排布的横向与纵向元素具有特异性影响。因此,本研究强调了将复合性状(如SD)分解为存在于HTP数据中但先前未被充分利用的组分性状集合,可以获得新的见解。
2 材料与方法
2.1 ML注释的玉米叶片数据
研究分析了来自一个B73 × Ms71玉米RIL群体的192个品系的数据。从每个基因型地块中,采集旗叶下第二片叶的叶片样本,利用掩码区域卷积神经网络(Mask R-CNN)工作流程从微图像中确定了气孔的位置和大小。分析中使用了每个气孔掩模的质心坐标及其大小(长和宽)。
2.2 SPP分析流程概述
SPP的量化包括以下步骤:(1)评估气孔之间的最近邻距离和位置;(2)将最近邻的距离和位置信息相对于原点气孔进行归一化,使其围绕一个共同的“原点气孔”中心化;(3)将这些归一化散点图中的空间信息概括为二维核密度分布(KDD),即二维概率分布;(4)从这个空间表型中提取量化其变异的性状。
2.3 用于近似平均气孔邻域的排序最近邻分析
使用曼哈顿距离公式计算每个“原点”气孔质心与图像中所有其他气孔之间的最近邻距离。为避免边缘效应,仅允许距离图像边缘至少50 μm的气孔作为原点气孔。然后计算每个原点气孔到其前五个最近邻的距离和方向,并以相对基础进行表达。
2.4 气孔排布表型的核密度分布
归一化最近邻的空间分布在不同基因型间存在差异,但具有共享的几何结构。这使得该方法具有普适性,表型变异可量化为二维KDD。根据所评估的气孔排布特征,KDD可以为不同组合(或平均)的第一至第五排序的最近邻气孔生成。
2.5 SPP性状注释与提取
从SPP热图中提取了一系列15个SPP性状,这些性状大致分为四类:(1)区域概率信号;(2)区域概率方差;(3)平均区域距离;(4)平均间距估计。这些表型通常根据纵向或横向的空间信息进一步分解,分别称为“文件内”或“侧向文件”性状。核心的SPP衍生性状包括文件内概率(Sif)、沟概率(Str)、侧向文件概率(Ssf)、文件内细胞数(ICN)和文件间距数(FSN),以及气孔复合体长度(SCL)和宽度(SCW)。
2.6 性状降维与关联分析
利用主成分分析(PCA)和皮尔逊性状相关性来识别性状间的关联,并通过一系列预测SD的线性模型,进一步评估构成核心SPP性状集合的最小子集。最终确定了一个包含7个核心SPP性状的集合。随后使用分段结构方程模型(pSEM)评估这些核心性状之间的功能层级关系。
2.7 SPP性状的遗传作图
将所有性状与现有的基因型测序图谱合并,使用Haley-Knott回归进行多基因座QTL扫描。通过动态生成的LOD阈值筛选区间,并对每个性状进行了遗传力估计。
3 结果
3.1 SPP表型关键特征描述
分析揭示了气孔排布的规律模式。排名第一或第二的最近邻气孔倾向于位于与原点气孔相同的细胞文件中,或位于附近细胞文件的对角相邻位置。相比之下,排名第三的最近邻气孔更常见于距离原点气孔几个细胞文件的横向位置。将向量相对于其原点气孔坐标归一化后,显示出钻石状的散点图形态。根据这些散点图生成的热图(概率图)可以直观地量化和可视化不同基因型在纵向和横向间距上的遗传变异。SPP形态在整个RIL群体中具有普适性,表明它是玉米中气孔局部“邻域”的一种保守的、自我重复的排布方案。
3.2 SPP性状关联及关键表型变异来源识别
配对相关性分析显示,Sif与细胞密度指标SD和PD呈显著正相关,而Str则与两者呈显著负相关。概率性状Sif和Saf以及Str和Ssf分别形成两个关系密切的组。通过PCA和线性模型预测,研究确定了一个能够最好地解释SD变异的最小性状集。模型6(包含SCL、SCW、ICN、FSN、Sif、Str和Ssf这7个核心性状)能够解释约74%的SD变异。
3.3 用于识别SD变异因果路径的结构方程模型
SEM揭示了核心SPP性状集合与SD之间的相互作用网络。细胞间距性状(ICN和FSN)以及气孔大小和形状(SCL和SCW)作为独立的因果驱动因素。概率性状Sif、Str和Ssf作为细胞间距和大小的从属性状,最终将解释性变异输入到SD。该模型中观察到的最强路径是FSN → Str→ SD,突出了气孔排布的横向和纵向元素可以相互作用。最终,Sif是SD变异产生的主要节点。
3.4 SPP性状的遗传作图
对于传统的SD测量,QTL作图结果与先前研究大部分重叠。SPP性状的QTL通常与SD及气孔大小和形状相关的QTL共定位,并且经常出现在明显的多效性热点区域。在13个SD QTL中,有12个与SPP性状的QTL共定位。最强的两个SD区间是9号染色体上的QTL9和1号染色体上的QTL1B。这些SD QTL被发现与各种组合的SPP性状共定位,表明SPP方法可以将许多QTL重新分类为专门影响SD的纵向或横向组分的QTL。例如,最重要和第三重要的SD位点QTL9和QTL1A,被重新定义为分别影响气孔排布纵向和横向成分的位点。
4 讨论
4.1 玉米B73 × MS71 RILs中构成SD的核心SPP性状
研究表明,细胞文件系统是SPP变异的主要来源。Sif作为气孔文件纵向连续性的一个代理指标,在本研究中与SD始终表现出强烈的正相关关系。SPP形态在整个RILs中具有普适性,表明它是玉米中气孔局部“邻域”的一种保守的、自我重复的排布方案。增加相邻气孔之间的距离本身就应该足以增加SPP所描述的概率分布的紊乱度。
4.2 建模揭示预测SD的SPP性状及其在B73 × MS71 RILs中的结构相互作用
PCA和比较解释不同性状组合的线性模型,能够识别出一组解释SD的核心性状。对这些核心性状进行分段SEM分析,可以探索它们的因果相互作用。SEM结果表明了一个层级结构:以细胞大小和间距性状(SCL和ICN定义纵向效应,SCW和FSN定义类似的横向效应)为起始。这些初始性状将变异输入到后续的三元概率表型(Sif、Str、Ssf),这些表型定义了SPP本身的分布,并最终影响SD。在该RIL群体中观察到的最强路径是FSN → Str→ SD。尽管该路径分析的某些部分与现有文献一致,但这些层级不应与发育序列混为一谈。例如,SCL出现在SEM层级的前端,但它很可能是扩展生长的产物,根据文献描述的发育事件顺序,它应该是最后出现的性状之一。
4.3 将SD的遗传基础分割为其潜在的SPP性状影响
尽管能够识别多个SD、大小和形状位点,但构成我们SPP表型的组分性状,特别是ICN,相比之下似乎仅具有中等遗传力。对此差异存在三种可能的解释。首先,这些表型的表型变异本质上是随机的。其次,该RIL群体内可用的遗传变异可能有限。第三,一些组分性状可能不一定以加性方式起作用。与先前使用该群体的研究一样,SD被发现是多基因的。然而,当前的研究能够对先前被描述为通用SD位点的位点获得新的时空发育见解。SD位点通常与一个或多个组分性状QTL相关联,这种组合通常表明其在气孔/叶片发育中的特定作用。因此,SPP方法使得许多QTL可以被重新分类为专门影响SD纵向或横向组分的QTL。鉴于SEM中Sif与SD的直接关联,本研究中效应最强的SD位点QTL9似乎通过这条Sif→ SD路径起作用,这并不令人意外。