动物线粒体基因组|从结构多样性和更高层次的系统发育基因组分析看螳螂目的线粒体基因

动物线粒体基因组 从结构多样性和更高层次的系统发育基因组分析看螳螂目的线粒体基因
Exploring the Mitogenomes of Mantodea: New Insights from Structural Diversity and Higher-Level Phylogenomic Analyses
时间:2023杂志:International Journal of Molecular Sciences 影响因子:4.9 分区:1/2区
背景导读
螳螂目(Mantodea)高等分类群之间的关系仍是存在难点,目前,螳螂目分类在解决已有的同源性问题方面取得了重大进展。本研究对23种螳螂的线粒体基因组和核基因序列进行测序,同时结合53种已发表的螳螂数据,对螳螂目线粒体基因组和系统发育关系进行了分析。研究揭示了螳螂目线粒体基因组的保守性,存在少数tRNA基因重排,首次检测到trnL2重复。螳螂目线粒体基因组系统发育分析表明,马岛螳科Majangidae的系统发育位置应该在螳科Mantidea内,接近Manticidea,而不是与冠螳科Epaphroditoidea聚类在一起。本研究发现有助于理解螳螂目线粒体基因组的组成和结构多样性,强调进化模型选择在系统发育学研究中的重要性,并为螳螂目的高级系统发育提供新的见解。
研究目的
1、探索螳螂目线粒体基因的重排现象;
2、结合已发表数据,收集构建相对稳健的基于线粒体基因组的螳螂目14科和6个超科物种系统发育树。
研究对象及研究方法
1、研究对象本研究中23个新测序物种采集自野外。从标本中抽提样本DNA,Illumina测序。
2、研究方法组装线粒体基因组,Mito Z软件进行线粒体基因注释,Geneious校正。同时分析线粒体基因组结构特征以及系统发育进化关系。

图1 代表十个螳螂目超科的物种的生活习性图像及其多态隐藏策略
主要结果
1、螳螂目线粒体基因组结构
本研究获得了23个新测序物种的完整线粒体基因组,长度从15499bp到16186bp不等。大多数物种包含37个基因(2个rRNA、13个PCG和22个tRNA)和一个大的非编码区,除了Deiphobe yunnanensis、Eremiaphila sp.、Euchomenella heteropteran、Choeradodis rhombicollis、Thesprotiella sp.和Angela sp.。其中观察到几个tRNA重复(图2)。注释显示,在Deipobe yunnanensis中有两个相同的trnL2拷贝,它们之间插入了73bp的间隔序列,在Eremiaphila sp.中有两种相同的trn Q拷贝,中间插入了51bp的间隔序列。结合已发表的序列,在76个螳螂目线粒体基因组中观察到三个重排热点,即tRNA基因簇CR-I-Q-M-ND2、COX2-K-D-ATP8和ND3-A-R-N-S-E-F-ND5,而ND1-L2-16S基因簇中trnL2的重复是首次在螳螂目中发现的(图2)。

图2 螳螂目76个物种种线粒体基因重排研究。tRNA基因由其一个字母对应的氨基酸表示,tRNA基因重排以颜色表示。
2、螳螂目线粒体基因组的核苷酸组成和进化速率
分别使用AliGROVE对不同数据集的序列变异的异质性进行评估。结果显示,Empusidae、Metalliticus splendidus、Thesprotella sp.、Haania sp.和Macromantis hyalina的异质性高于其余谱系。在线粒体PCG的第三密码子位置发现了显著加速的进化(平均相似性得分=0.139),在许多早期分支超科中主要是负相似性得分。随着第三个密码子位置的去除,序列异质性降低。在组成多样性分析中,所有物种的序列都显示出较高的A+T含量,范围在69.2-77.4%之间。在15个超科中,Haanioidea的A+T浓度最高(76.4±0.8%)。比较Gonypetodea的两个亚科Gonypetinae和Iridpteryginae的核苷酸组成,其A+T含量分别为70.1±1.6%和74.8±0.4%。这种谱系内的差异可能导致相关物种的远距离分布,并产生错误分离。76个螳螂目线粒体基因组的Ka/Ks值在0.15-0.28之间,在科水平和超科之间也有很大差异(p<0.001。Haanioididea的进化速率加快(Ka/Ks=0.25)。这些结果表明了螳螂目线粒体基因组中的谱系特异性进化速率。由于这种明显更高的成分差异,Haanioididea物种在拓扑结构中可能没有稳固的位置,或者可能错位。
3、基于位点同源模型和简约法(Parsimony Methods)的系统发育分析
在位点同源模型下,对四个数据集和三个数据优化策略的最大似然分析一致地呈现了以下单系分组结果(表1):异足目和前足目超家族以及Chroicopteroidea、Nanomantoidea和Eremiaphilidea超科。然而,在不同的数据集和划分方案中,其他谱系的系统发育关系是不一致的。在PCGRNA/NGPCGRNA基因划分分析中,公认的裂螳下目(Schizomantodea)未恢复为单系。在Artimantoda中,Amerimantodea在所有分析中都未能恢复为单系群,Manticidea仅在NGPCGRNA基因划分中恢复为单属,但BP较低(0.49)。在早期分支超科中,金螳总科(Metallyticoidea)的位置是高度可变的,包括所有剩余的螳螂总科的姊妹群以及与Thespoidea或Angelidae的聚类,这可能是错误的分组,因为这三个群具有非常相似的碱基组成和进化速率(图3)。在Cernomantodea的早期分支中,Haanioididea可能是错误谱系,与Thespoidea、Epaphroditidae、Chroicopteroidea或Gonypetinae分组可变,使这些拓扑结构在系统发育中不稳定。在更多衍生的Cernomantodea超科中,第三个密码子位置分析倾向于将Empusidae归类在Promantidea之外,使Hymenopoidea成为副系。除NGPCGRNA基因划分外,在所有分析中,Galinthiadea都嵌套在(Mantoidea+Hymenopoidea)分支中。这些结果与Mantodea内目前接受的关系不一致。总之,使用位点同源模型的ML分析显示出有限的潜力,不同数据集和划分方法之间关系非常不稳定,特别是关于早期分支。
与基于模型的系统发育学相比,最大简约分析获得的进化树总体上分辨率和支持度较低(表1),这可能在一定程度上反映了螳螂目线粒体基因组在谱系之间的异质序列差异。然而,在所有MP分析中都恢复了Schizomantodea和Nanomantoidea总科、Eremiaphilidea和Chroicopteroidea超科的单系性。

表1 使用PhyloBayes(BI)、IQ-TREE(ML)和TNT(MP)获得的关键节点的重建
注:在所有分析中未能恢复的类群不包括在表格中。缩写:N,无分区;G,基因分区;C,密码子分区;NS,不支持。PR,PCGRNA数据集;P12R,PCG12RNA数据集;NPR,NGPCGRNA数据集;NP12R,NGPCG12RNA数据集。MHEC,(Miomantoidea + Hoplocoryphoidea + Eremiophiloidea)类群。MECE,(Metallyticoidea + Ceromantodea)类群。GNC,(Gonypetoidea + Nanomantoidea)类群。GMC,(Galinthiadoidea + Mantidea)类群。*表示Majangidae嵌套的类群。

图3. 基于同质位点模型的系统误差在系统发育分析中。选择从PCGRNA无分区分析中获得的根ML树来绘制序列之间的平均相似度得分、A + T含量、Ka/Ks和分支长度值。拓扑图上的数字(1-9)表示对应类群或末端的标识符:(1) Haania sp.,(2) Caliris sp.,(3) Arria pallida,(4) Gonypetinae,(5) Iridopteryginae,(6) Empusidae,(7) Hymenopodidae,(8) Deroplatyidae,(9) Mantidae。序列之间的平均相似度得分由彩色方块(上方图例)表示,基于AliGROOVE得分,范围从-1(表示与数据集中其余部分差异很大,红色着色)到+1(表示与所有其他比较一致,蓝色着色)。A + T含量(%)和分支长度来自PCGRNA数据集,而Ka/Ks值是基于13个PCGs计算的。缩写:SF:superfamily;PR:PCGRNA数据集;P12:PCG12数据集;P3:PCG3数据集;Mat,Mantoidea;Gal,Galinthiadoidea;Hym,Hymenopoidea;Ere,Eremiaphiloidea;Hop,Hoplocoryphoidea;Mio,Miomantoidea;Nan,Nanomantoidea;GManon,Gonypetoidea;Chr,Chroicopteroidea;Haa,Haanioidea;Epa,Epaphroditoidea;Aca,Acanthopoidea;The,Thespoidea;Met,Metallyticoidea;Man,Mantoidoidea;Out,Outgroups。
4、位点同源模型下的系统误差
我们通过将A+T含量、Ka/Ks值和分支长度的结果绘制在系统发育树上,对线粒体系统发育组学进行了误差分析,该树是在位点同源模型下通过PCGRNA无划分分析获得的(图3)。序列异质性和分支长度总体呈下降趋势,A+T含量和Ka/Ks比值也有较大差异。在AliGROOVE分析中,发现了螳螂目线粒体基因组的几个谱系特异性差异,这与ML拓扑下这些谱系的几个意想不到的分组相对应(图3)。例如,在Hymenopoidea中,尽管所有序列都呈现出正相似性得分,但在Hymenopoidea和Empusidae之间发现了高度异质的序列差异,平均相似性得分分别为0.76和0.61(图3,分支6和7)。在Haanioidea的Caliridinae和Haaniinae(图3,分支1、2和3)、Gonypetoidea的Gonypetinae和Iridpteryginae(图3,分支4和5)以及Mantoidea中的Deroplatyidae和Mantidae(图3,分支8和9)之间也发现了谱系特异性差异。这些分类群表现出谱系内异质序列的差异,并且在ML拓扑中容易被放置得很远。在更大的范围内,一些谱系在谱系内核苷酸组成上比其他谱系更具异质性,并且它们在位点同源模型下的内部关系对模型或数据集的变化也相对敏感。例如,早期分支的Cernomantodea(包括Chroicopteroidea、Haanioidea、Gonypetoidea和Nanomantoidea)的平均A+T含量为73.3±4.0%。相反,Promantidea的核苷酸组成变化更为均匀,平均A+T含量值为75.0±1.2%。在ML拓扑结构下,四个早期分支超科之间的关系也有所不同。在较小的范围内,一些不相关分类群的错误分组可能是由成分趋同引起的。例如,在不同的ML分析下经常发现的Metallyticoidea和Thespoidea的意外分组,在序列中显示出非常接近的组成和进化率。此外,一些具有不同A+T含量的亲缘物种,如Gonypetoidea的Gonypetinae(70.1±1.6%)和Iridpteryginae(74.8±0.4%),在ML系统发育中始终处于较远的位置,进一步证实了上述异质性分析的结果。谱系间Ka/Ks值的对比也表明了螳螂目线粒体基因组的异质性。表现出高A+T含量的物种通常具有显著的Ka/Ks值(例如haanioidean谱系)。总的来说,这些结果揭示了不同谱系螳螂目线粒体基因组之间的高度异质序列差异,这可能严重阻碍使用位点同源模型的系统发育重建。
5、站点异构模型下的系统发育分析
在CAT+GTR模型下对四个数据集进行的贝叶斯分析产生了具有相对稳定关系的拓扑结构,这些拓扑结构与目前公认的系统发育结果更加一致(图4A;表1)。对于早期分支支,在所有分析中都恢复了裂螳下目(Schizomantodea)的单系性。使用NGPCGRNA数据集恢复了Amerimantodea的单系性。大多数超科的单系性也得到了恢复,但Acanthopoidea、Gonypetoidea和螳螂总科除外。对于超科关系,Mantoidoedea被强烈支持为Mantoodean谱系的姐妹群。金螳总科和其他超科的意外分组(例如,作为Thespoidea的姊妹组),得到了几个位点同源模型分析的支持。Schizomantodea被恢复为(Amerimantodea+(Epaphroditoidea+(Metallicoidea+ remaining Cernomantodea)),其中(MetalliCoidea+ remaining Cernomentodea)分支进一步分为两个主要谱系。尽管Gonypetodiea的单系性不受支持,其中一个深分支是((Metallyticoidea+Haanioididea+Chroicopteroidea)+(‘Gonypetoidea’+Nanomantoidea))。在ML分析以及现有的线粒体系统发育组学中,Gonypetoidea中的Gonypetidae的两个亚科经常被置于较远的位置,而在CAT+GTR模型下,它们一直被发现是异系的,并与Nanomantoidea归为一类。另一个分支Heteromantodea,与Miomantoidea、Hoplocoryphoidea和Eremiaphilidea聚集在一起,作为Promantidea的姊妹群,BPP大于0.90。此外,在使用PCGRNA、NGPCGRNA和NGPCG12RNA数据集(BPP=1)的分析中,Galinchiadoidea置于Manticidea之外,这表明它与Hymenopoidea的关系更为遥远。这一发现与之前的形态学和分子讨论一致。在来自PCGRNA和NGPCGRNA数据集的同源模型下经常发生的Hymenopoidea的意外多系性没有恢复,所有贝叶斯分析都强烈支持单系Hymenopoidea(BPP=1)。未解决的Majangidae家族被发现比之前报道的更具起源性,并且在所有分析中都被一致地放在Manticidea中,作为Mantidae的姊妹群。使用PhyloBayes的四个数据集产生的拓扑结构之间的主要不一致在于Amerimantodea的重建以及Metallyticoidea、Haanioidea和Chroicopteroidea在Cernomantodea底部的位置。在一般情况下,在PhyloBayes分析中,使用CAT + GTR模型的拓扑结构中没有观察到基于同质模型的上述许多支系的意外关系,这可能归因于系统误差,这表明了位点异质混合模式中异质演化过程的“修正”效应。这种模式纠正了许多线粒体谱系的意外关系,将Metallyticoidea、Haan- ioidea和Chroicopteroidea放置在Cernomantodea基部。

图4 在站点异构混合CAT+GTR模型(A)下,通过对四个数据集的PhyloBayes分析推断出螳螂目的系统发育。节点处的贝叶斯后验概率;从左到右的顺序是NGCGRNA、PCGRNA、NGCG12RNA和PCG12RNA。低于0.4的BPP表示为“−”。使用FcLM(B)的系统发育内容支持关于四个不稳定超科(Haanioidea、Gonypetoidea、Nanomantoidea和Chroicopteroidea)的四个数据集的当前拓扑结构。
6、检验替代假设
在分析了螳螂目线粒体基因组之间的异质序列差异后,作者首先在ML分析中采用不同的数据优化策略来建立优选的拓扑结构。然而,如上所述,在位点同源模型下,数据划分、异构密码子位置去除、模型选择和核基因添加显示出减少系统偏差的潜力有限。在位点同源模型下使用这些策略也倾向于将拓扑结构转向基于CAT+GTR的结果。此外,基于CAT+GTR的拓扑结构在大多数分支的较高节点支撑方面显示出优势(表1)。这些结果表明,在螳螂目系统发育重建中,位点异质模型下的拓扑结构优于位点同质模型下的。此外,先前的研究表明,在基于GTR的测试中,在CAT+GTR混合模型下获得的拓扑结构是不合理的。因此,如果测试既包括基于GTR的拓扑结构,也包括基于CAT+GTR的结构,后者通常会被强烈拒绝。如果出现这种情况,PhyloBayes拓扑之间的进一步比较将是不准确的。考虑到这两个因素,在随后的拓扑分析中没有包括ML树。坐着在基于四个数据集的GTR+G模型下进行了拓扑测试,以研究在补充核基因前后,在科水平上对源自PhyloBayes的四种拓扑结构和两种先前假设的接受程度(表2)。先前的两个假设代表了最新的多源分子位点结果和全证据分类框架。前一项分析表明,NGPCGRNA数据集的拓扑结构更容易接受,并得到三个数据集(NGPCG12RNA、NGPCGRNA和PCGRNA)的更好支持。NGPCGRNA的这种更好支持的拓扑结构恢复了Amerimantodea的单系,这在其他分析中很难建立。后一种分析表明,Schwarz和Roy的分类框架得到了所有数据集的有力支持,而Svenson和Rodrigue假设仅在添加了核基因片段(NGPCGRNA和NGPCG12RNA)的线粒体基因组数据集中被接受。在结合这两个结果(表2)和系统发育中的节点支持(表1)后,我们得出结论,在理论和实践分析中,补充核基因改善了拓扑结构。因此,在CAT+GTR模型下,将优选拓扑确定为来自NGPCGRNA和NGPCG12RNA数据集的进化树。四种PhyloBayes拓扑结构一致地将早期分支的cernomantodean群恢复为((Chroicopteroidea+Haaniodea+Metallyticoidea)+(‘Gonypetoidea'+Nanomantoidea))。除了Metellyticoidea,其余四个超科之间的关系在不同的数据集以及ML分析中的数据优化策略之间变化很大。因此,作者使用FcLM来测试该分支的替代关系,并评估每个数据集中的不一致或错误信号(图4B)。该分支在四个数据集中的平均非信息比例仅为10.9%,表明所有数据集都为系统发育重建提供了可信的信息]。结果一致地确定了对这种关系的最高支持((Chroicopteroidea+Haanioidea)+(Gonypetoidea+Nanomantoidea)),从而匹配了PhyloBayes拓扑结构(图4)。

表2 本研究中从站点异构CAT+GTR模型导出的四个假设和先前研究中被广泛接受的两个假设的拓扑测试
1.Schwarz和Roy,2019:基于多重证据的螳螂目最新系统发育框架,重点关注雄性生殖器官(不包括Majangidae)。
2.Svenson和Rodrigues,2017:基于九个基因(五个线粒体基因片段和四个核基因片段)的ML螳螂目系统发育树,首次包含了所有16个超科(排除了Majangidae)。deltaL表示与集合中的最大logl的对数差异。bp-RELL表示使用RELL方法得出的自举比例。p-KH表示单侧KH检验的p值。p-SH表示SH检验的p值。p-WKH表示加权KH检验的p值。p-WSH表示加权SH检验的p值。c-ELW表示预期似然权重。P-AU表示AU检验的p值。+表示在95%置信区间内的值。−表示显著排除的值。
总结
我们的研究利用包含线粒体基因组和核基因的大型数据集构建了一个螳螂目的家族级系统发育关系。作者发现,多种tRNA重复在整个Spinomatodea中普遍存在,首次在螳螂目中检测到trnL2重复。序列特征的分析首先证实了螳螂目线粒体基因组之间的谱系特异性组成异质性,表明模型选择对解决螳螂目的系统发育至关重要。补充核基因也可以改善线粒体的系统发育拓扑结构。拓扑测试和FcLM选择的最终结果支持了当前分类系统中的大多数分支关系,将金螳总科嵌套在Artimantoda中,并恢复epaphroditoidean谱系Epaphroditidae作为Cernomantodea其余部分的姊妹群,而Majangidae是Mantidae的姊妹群。对于Cernomantodea的早期分支((Chroicopteroidea+Haanioidea)+('Gonypetoidea'+Nanomantoidea)),以及Heteromantodea的衍生谱系((Miomantoidea+Hoplocoryphoidea+Eremiaphilidea)+Promantiea),也提出了新的支持假说。因此,作者建议使用位点异质性模型进行进一步的研究,过滤最佳策略,增加分类群采样,特别是增加基部和有争议类群,并使用多样化的数据集来更好地解决螳螂目系统发育问题。
本文来自:物种分类及进化研究-公众号
最后编辑于 2024-12-30 · 浏览 439