不同栽培地点柳枝稷根际微生物群落的遗传决定因素
文献信息
Edwards J A, Saran U B, Bonnette J, et al. Genetic determinants of switchgrass-root-associated microbiota in field sites spanning its natural range[J]. Current Biology, 2023.00398-6?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS0960982223003986%3Fshowall%3Dtrue)
研究材料
这个研究中使用的材料来自于Genomic mechanisms of climate adaptation in polyploid bioenergy switchgrass这个研究所用的柳枝稷群体。研究所用的群体可以分为3种亚群,分别用蓝色、黄色和红色进行标注。白色的圆圈表示代表性的采样地点,圆圈里面有×的表示10个用于试验的园区(基地?)。
主要方法
核心微生物鉴定
这个研究一共有三个地点,作者将每个地点中在80%样品中都出现的微生物定义为核心微生物,三个地点核心微生物的交集部分定义为study-wide
核心微生物。使用80%作为阈值的理由有两个:
- 已经有相关研究使用这个阈值;
- 本研究中的分析对数据分布和统计功效非常敏感。
作者也对不同的阈值进行了比较分析。
哪个分类水平用于计算细菌遗传力最佳?
什么是遗传力
呢?简单来说就是某个性状在群体中的变化多大程度上是由遗传因素决定的。比如身高,可以遗传因素可以占到80%.
在这个研究中,作者就探究了不同分类水平下柳枝稷根际微生物的遗传力,发现ASV水平下根际微生物的变异和寄主遗传变异相关性程度最高;当使用Order
或者是Family
水平进行计算时,也能得到较高的遗传力。这也就说明说明植物并不是募集特定的微生物,而是更倾向于募集具有特定功能的微生物群落。但是作者说他们在计算遗传力的时候起始是根据采样部位来决定的,也就是不同部位的微生物的遗传力用不同分类水平进行计算。我的观点:管他什么水平,全部计算了再说!
复合对称模型(Composite Symmetry Model)是用于估计遗传和环境的方差成分的模型之一。它假定基因和环境都对个体产生相同的影响,而且这些影响是相互独立的。具体来说,这个模型假设基因对遗传效应的贡献是相同的,环境对环境效应的贡献也是相同的。因此,复合对称模型可以很好地解释许多与遗传和环境相关的现象,比如兄弟姐妹之间的相似性、亲属之间的遗传相关性等。在使用该模型时,需要先确定遗传和环境的方差,然后通过复合对称模型分别估计基因对遗传效应和环境对环境效应的贡献。
mGWAS
先对每个采样田做个PCoA分析,前三个主坐标值用于GWAS分析。每个采样点筛选80% 以上样品中出现的微生物。使用柳枝稷专用的GWAS分析R包SwitchgrassGWAS完成分析。
多功能位点挖掘
为了找到柳枝稷基因组上调控多个微生物的关键区域,作者根据其他研究中的连锁不平衡衰减距离将柳枝稷基因组切割为25 kb长的bins,然后计算每个bins中的SNP和微生物的相关性阈值,最终留下0.5%具有最低阈值的bins,这些bins被定义为QTL bins. 然后对这些QTL bins进行存在/缺失分析,构建存在/缺失矩阵。某个地点选择5个与最多的微生物相关的QTL bins进行后续分析。
研究结果
寄主和环境对柳枝稷根际微生物的影响
这个研究采样的方式还是比较独特的,下图中的×表示采样点,采集所有样品后,统一运送到ATX这个地方培养,然后再运输去其他两个地方,一共三个培养地点进行培养。
拿到这些根际微生物后,上来就是很常见的PCoA分析,可以看出三个地点栽培的柳枝稷的根际微生物显著不同(下图A),进一步对门水平的微生物进行发现Actinobacteria(放线菌门)和 Proteobacteria(变形菌门)在三个地点都是优势菌门(下图B)。再往下,作者想看看寄主的遗传差异和环境以及这两个因素对微生物的影响情况,发现地点对微生物的影响更大(下图C),对门水平进行类似的分析也是一样的结果(下图D)。这几个结果就说明影响柳枝稷根际微生物的主要因素是地点,但是寄主的基因型也有很明显的影响。进一步研究发现平均相对风度更高的微生物同时也是存在率最高的(下图E),这个比较好理解,只有出现次数多了,才会越来越多。这个研究中,研究者定义了地点核心微生物和研究核心微生物,简单理解的话就是每个地点的核心微生物中同时出现的微生物定义为研究核心微生物。从下图F可以看出研究核心微生物有92个。进一步比较地点核心微生物和研究核心发现,地点核心微生物占总微生物的60~70%,总核心微生物占总微生物的25%左右。这些结果整体上说明虽然地点对柳枝稷微生物影响很大,但是还是有很大一部分微生物是不同地点共有的。
寄主基因型和当地微生物的亲和性
前面的研究发现柳枝稷的基因型以及基因型对根际微生物的影响也比较大,作者就猜想不同基因型的柳枝稷是否会和当地的微生物产生亲和效应,从而募集到特异性的微生物?从下图A可以看出采样的这些柳枝稷来自不同亚群,而且不同的亚群分布在不同的地点,比如Gulf这个亚群主要分布ATX附近,CMO和KMI这两个地点分布的主要是Midwest这个亚群。为了验证这个猜想,作者就对微生物进行富集分析,发现在ATX这个地点终止的柳枝稷主要是Gulf这个亚群募集到更多的特异性微生物,其他两个地点富集到特异性微生物的主要是Midwest这个亚群(下图B)。进一步分析发现有意思的是只有当地适合的那个亚群富集到的微生物进行统计分析才具有显著性(下图C)。这些结果充分说明柳枝稷基因型和局部微生物间有明显的亲和性。
基因型变异影响微生物丰度
在上述结果的基础上,作者想进一步探究柳枝稷基因型以及基因型和环境互作对根际微生物的影响。分别考虑两个变量:
- $V_A$: 加性遗传影响,也就是基因型的影响;
- $V_{GxE}$:基因型和环境的互作效应
从门水平到ASV水平都进行了统计分析,发现这两个因素都会影响微生物的丰度(下图A)。将每个分类水平下受到这连个因素影响排名前十的微生物挑出来进一步分析发现,随着分类水平的细化,遗传因素对微生物的影响越大,反之基因型和环境互作效应的影响在逐渐减小,但是在ASV水平上依旧是比较高的(下图B)。在此基础上再进行细化分析,发现有三个Order下的ASV都显著受到这两个因素的影响(下图C,这个每台看懂。。。)。从整体上看,基因x环境互作效应对微生物的影响比基因型单独的影响明显(下图D)。利用非结构模型发进一步分析遗传因素对总核心微生物的影响,发现不亚群的遗传背景对总核心微生物的影响差异明显(下图E)。总之,这些结果说明寄主的遗传差异在很大程度上影响着柳枝稷根际微生物的多样性。
微生物组组装具有多小遗传效应
有那么多样本,基因组也有,微生物组也有,那就肯定是要上mGWAS的。首先,作者没有直接利用微生物作为表型,而是将微生物组PCoA的前三个主成分作为表型进行GWAS分析。毫不意外,找到一大堆关联位点(下图)。
既然上面的结果都说明了基因型和环境互作效应对微生物的影响更大,那肯定是要从这个方向分析做GWAS的。作者使用的组合是ASVx地点这种形式,一共是有1019个单独的分析。发现1153个SNP和459个ASVx地点显著关联,其中ATX这个地点有253个、CMO有101个、KMI有105个。这些ASV非常丰富,但是没有重叠的(不知道我有没有理解对这句话)(下图A)。其中有50个ASV出现在两个及以上地点,有9个ASV在三个地点都是显著的。在这个基础上,作者想继续探究柳枝稷根际微生物的变化是否会受到寄主多位点的调控,于是就将柳枝稷的基因组切割成25 kb长度的片段,再分析一个片段内是否有两个及以上的显著位点。具体的方法是筛选每个地点中与最多的ASV关联的基因组片段 ,选择前5%作为每个地点中最常见的基因组片段。既然这些篇段都找到了,那就看看这些片段中的基因的表达情况(下图B),结果发现这些基因在根部的表达量更高,这是符合实际的,只有在根部表达量高才会直接富集根际微生物。而且比较有意思的点在于这些基因大多和钙信号、免疫和次级细胞壁生物合成相关。下图C我就完全没看懂了,图例也没写清楚,大概表示每个基因组片段显著富集到的微生物群。下一个分析操作我觉得是比较有意思的,作者猜想不同基因组片段和它特异性富集的微生物之间的序列有没有显著的相关性呢?一波分析发现确实是有显著相关性的(下图D)。加上一系列的分析后作者认为寄主的相关代谢通路的变化会影响富集到的微生物群落特征。
为了更好地探究不同地点对微生物群落的影响,作者使用了一种类似于Meta分析的方法将三个地点GWAS结果中的P值进行整合,一共有239个SNP在阈值之上,92个总核心微生物中有44个显著被关联到(下图A)。下一步比较有意思的操作是对ASV进行GO富集分析(下图B),一共富集到76个唯一的GO条目,苹果酸运输和细胞壁生物合成是最显著的两个通路,而苹果酸是植物根系分泌物中塑造根际微生物群落过程中的重要物质。这些结果说明虽然环境是决定柳枝稷根际微生物群落的最主要因素,但是还是有一些微生物及其相关的寄主遗传位点是不同环境地点所共有的。简单来说就是有些遗传位点非常重要!
PTI响应与根际微生物组成相关
作者之所以会这样想的原因在于他们认为控制植物PTI响应的某些位点(片段)和控制根际微生物组的位点是一样的,那么就猜想调控PTI的位点是否会调控根际微生物群落特征。为了验证这个猜想,作者就对ATX这个地点的样品进行采样,然后利用flg22处理叶片,利用酶标仪读取ROS荧光信号,发现flg22处理后柳枝稷ROS爆发明显(与CK相比)(下图A和B)。在这个基础上,作者将测量得到的数据利用PCA降维,不看测量值,看主成分(下图C,貌似没啥意义)。我觉得这个文章数据分析中最有意思的点在于这里将PCA值取前5%和最后的5%进行比较,再去比较这两种情况下的荧光信号值。下图D可以看出PC1可以作为区分植物有没有响应flg22的指标,红色的响应明显,黑色的几乎没有荧光;PC2可以看出有些植物是快速响应的,有的是逐渐响应的;PC3则可以看出不同植株响应的时间是不一样的。
起始还没有解释他们的猜想,于是就用PC值和ATX中的核心微生物进行关联分析(下图),发现739个ASV中有126个和主成分显著相关。PC2和PC3关联到的微生物很少,而且基本都是负相关的;反之PC1关联到更多的ASV,而且呢正相关和负相关的数量基本持平。这个结果说明根际微生物组和植物免疫响应之间的相关性是收到遗传因素影响的,而且这种相关性不仅仅局限于某些特定的微生物。