【进展】文章解读-Nature Article 04042013-绦虫基因组序列测定
Title: The genomes of four tapeworm species revealadaptations to parasitism
题目:四种绦虫的基因组揭示如何适应寄生状态
Abstract
Tapeworms (Cestoda) causeneglected diseases that can be fatal and are difficult to treat, owing toinefficient drugs. Here we present an analysis of tapeworm genome sequencesusing the human-infective species Echinococcus multilocularis, E.granulosus, Taenia solium andthe laboratory model Hymenolepismicrostoma asexamples. The 115- to 141-megabase genomes offer insights into the evolution ofparasitism. Synteny is maintained with distantly related blood flukes but we findextreme losses of genes and pathways that are ubiquitous in other animals,including 34 homeobox families and several determinants of stem cell fate. Tapewormshave specialized detoxification pathways, metabolism that is finely tuned torely on nutrients scavenged from their hosts, and species-specific expansionsof non-canonical heat shock proteins and families of known antigens. Weidentify new potential drug targets, including some on which existing pharmaceuticalsmay act. The genomes provide a rich resource to underpin the development ofurgently needed treatments and control.
摘要 绦虫(Cestoidean)会引起常被人们忽略的疾病,其中有些疾病是致命的,而由于缺乏有效的药物对这些疾病很难进行治疗。在此我们使用可以感染人的绦虫种类包括多房棘球绦虫(Echinococcus multilocularis),细粒棘球绦虫(E.granulosus),有钩绦虫(Taenia solium)及一种实验室使用的小口膜壳绦虫(Hymenolepis microstoma)作为样本对其基因组序列进行分析。大小在115到141兆碱基之间的绦虫基因组序列为我们提供了寄生状态进化的情况。绦虫与亲缘关系较远的血吸虫具有同线关系,但我们发现在绦虫的基因组中很多在其他动物体内普遍存在的基因以及信号通道发生严重的缺失,包括34种同源框(homeobox)家族和几种决定干细胞命运的因素。绦虫具有特异性的解毒途径,精细调控的依赖于宿主废弃物的代谢活动,以及具有种属特异性的大量非经典热休克蛋白和已知抗原家族。我们确认了新的具有可能性的药物目标,包括一些已有药物的可能作用目标。整个基因组的内容对急需治疗和控制相关疾病的开发提供了支持性的丰富资源。
(正文部分)
包虫病(Echinococcosis,hydatiddisease)和囊虫病(cysticercosis)是由绦虫幼虫在重要器官中繁殖造成的,这两种病被世界卫生组织列为17种被忽略的热带疾病中的两种。绦虫的幼虫可以在人体内潜伏数年而毫无症状,最终导致各种使人衰弱的疾病以至死亡。当这两种病被诊断出来的时候,疾病往往处于晚期,手术治疗已经不可能了。绦虫感染在世界范围内非常广泛,其对人类造成的疾病负担预测为一百万伤残调整寿命年(DALY,1996年为WHO采纳作为评价疾病造成的影响),与非洲锥虫病,盘尾丝虫病以及登革热相当。另外,家畜囊虫病每年导致20亿美元的损失。
绦虫在宿主之间是被动传播的,它实际上可以在任何脊椎动物体内寄生。绦虫对寄生状态的形态适应包括无内脏,无头以及无光感器官,而且它们具有特殊的表面(外皮,tegument)可以抵抗宿主的胃酸胆汁但又可以吸收营养。
绦虫是寄生在人体中仅有的三种主要蠕虫之一,另外两种是血吸虫(Trematoda)和线虫(Nematoda),迄今它们的基因组序列还不可知。在这里我们展示一种感染人的绦虫多房棘球绦虫(Echinococcus multilocularis)的基因组序列。我们同时也展示其他三种绦虫的基因组序列作为比较,它们是细粒棘球绦虫(狗绦虫- E. granulosus),有钩绦虫(猪肉绦虫- Taenia solium)-这两种对人都有感染性-和小口膜壳绦虫(啮齿类绦虫,实验室作为人寄生虫模型短小绦虫-hymenolepis nana)。我们完成的基因组工作为针对绦虫及其他寄生型扁平蠕虫开发急需的治疗措施提供了一个出发点。对于几种绦虫全基因组的了解将加速开发对抗绦虫的新工具和治疗措施的步伐。
绦虫的基因和基因组
多房棘球绦虫(Echinococcusmultilocularis)的基因组手工完成组装(补充2),在这一高质量参考基因组中,89%的序列包含于9条染色体上,仅有23个缺口(补充表1,2)。一条染色体是从端粒到端粒完成的,而预测18个端粒中的13个加入到骨架中(图1a)。这一质量和完整性与首次发表的线虫(Caenorhadditis elegans)和果蝇(Drosophilamelanogaster)的基因组相当。使用几种高通量技术对115-141兆碱基的绦虫基因组进行了序列测定(补充表1.1)。绦虫基因组大致上大小是其远亲血吸虫(Schistosoma mansoni)的三分之一,主要是其重复序列很少。通过对几个隔离的多房棘球绦虫序列的测定,我们在一个绦虫的原头结中发现了四倍体性以及9号染色体(最小的染色体,也许是唯一能容纳三倍体性的)暂时性在原头结中的三倍体性;以及在另外两个分离中发现了后绦幼虫(图1c,d,补充图3),这与以前观察到的扁形虫核型的可塑性相一致。
借助于多生命周期的深度转录组测序,我们在每一个基因组中确认了10,231至12,490个假定基因(补充表5)。与曼氏血吸虫的基因组相似,在绦虫基因组中存在“微外显子基因”,这些基因带有多个内部小外显子(一般小于36个碱基),小外显子的数量可以被3整除(补充部分5)。为研究绦虫基因获得或缺失状况,我们将绦虫基因与其它八种不同种属的基因进行了同源性分析(图2)。尽管基因次序已经丢失,但远古染色体同线性仍存在于寄生性扁形虫中(图1b,补充表7)。多房棘球绦虫的两个染色体(图1a,b)对应曼氏血吸虫的性染色体。在扁形虫中血吸虫由于其具有两性异形的特点而十分特殊,但绦虫和血吸虫共同的祖先如何进化形成像曼氏血吸虫那样雌性异形配子寄生虫的仍然有待阐明。
在绦虫基因组范围内对多顺反子的确认发现,在多房棘球绦虫中有308个未认证的顺反子,最大的含有4个基因。多房棘球绦虫多顺反子内部的基因次序大小与人猪肉绦虫和小口膜壳绦虫一样,而且某种程度上与血吸虫相似;39%与曼氏血吸虫同源的多房棘球绦虫多顺反子保持同线性,40%具有转录组以示其多顺反子的转录作用,进一步证实在漫长的进化时间内多顺反子的基因次序高度保守(补充部分6)。
通过剪接前导反式剪接可以将多顺反子解析为单个的编码转录物,但剪接前导反式剪接作用也可以在多顺反子外的基因上发生。使用深度转录物测序(RNA-seq)我们发现在多房棘球绦虫基因中有13%发生剪接前导反式剪接,远少于线虫(C.elegans)的70%以及被囊动物的58%。

Figure 1 | Genome ofE. multilocularis. a,The nine assembled chromosomes (Chr 1–Chr 9) of E. multilocularis with telomeres (red dots). Physical gaps in the sequenceassembly (white boxes with blue dot beneath) are bridged by optical map data. Eachcolor segment is defined as an array of at least three genes that each has asingle orthologous counterpart on one S. mansoni chromosome,regardless of their locations on the chromosome. b,One-to-one orthologues connecting E. multilocularis and S.mansoni chromosomes. c, Distribution of normalized genome coverage on isolate GT10/2.Each horizontal line depicts median coverage of 100-kb windows normalized againstthe mean coverage for the genome (130|). Evencoverage was observed across the first eight chromosomes, but 1.5|coverage of chromosome 9 indicates trisomy. Similar plots forother isolates are shown in Supplementary Fig. 3.1. d, Distribution of minor allele frequency (MAF) of heterozygoussites in five isolates of E.multilocularis (plotfor individual isolates in Supplementary Fig. 3.1), identified by mapping sequencingreads against the assembled chromosome consensus sequences. At each site, theproportion of bases that disagree with the reference is counted. For fourisolates, the MAF peaks at around 0.5, indicative of diploidy, whereas JAVA05/1peaks at 0.25, suggesting tetraploidy. Chromosome 9 of GT10/2 is plottedseparately (marked by asterisk) from chromosomes 1 to 8, and the MAF display aclear departure of 0.5 and peaks around 0.33, consistent with a trisomy.
图1 多房棘球绦虫基因组
a,多房棘球绦虫带有端粒(红点)的九条完成组装的染色体。序列组装中的物理性间隙由可见图谱连接(白色框下侧带蓝点)。每个有色区间是与曼氏血吸虫至少有三个每个含一个相应同源基因的部分,不考虑其所在染色体位置。b,与曼氏血吸虫一对一染色体同源性分析。c,归一处理后基因组在分离GT10/2上的分布。每条水平线表示100kb窗口以基因组平均覆盖值归一后的覆盖率中间值。前8条染色体具有平均覆盖值,但染色体9号具有1.5倍的覆盖率,说明其三倍体特性。其它结果示于补充图3。d,五条多房棘球绦虫杂合基因位点的最小等位基因频率(MAF)的分布,通过测序阅读与组装染色体一致性序列来确认。在每一个位点,计算与参照序列不同的碱基比例。对于4个不同的分离株,最小等位基因频率峰值达0.5,说明是二倍体,而JAVA05/1峰值达0.25,说明是四倍体。GT10/2株的9号染色体单独表示(*号),其MAF值在0.3附近,说明是三倍体。
图一总结 至少在五年内,测序的文章还会有,但不会越来越多,因为物种增加的速度是无法与人类科技进步速度相比的(很难说是好是坏,但我们没有选择)。但五年后这种测序就不会在Nature Article 上了,我敢肯定。测序目前能发文章最主要的是资源,因为花的钱多,所以不是谁都能做的。序列拿到手怎么能讲个更好的故事属于修饰阶段,意义非常重要,就是有点遥远。图一是绦虫的测序结果,当然我们不会对一堆ATGC感兴趣,更有兴趣的是通过ATGC在宏观上能看到什么。a是染色体,绦虫九条,对了,人几条来着?23对,46条,OK,什么最多?对,指一般的二倍体生物,什么生物具有最多条染色体?鲸鱼?不对,鲸鱼42-44条,取决于是蓝鲸还是抹香鲸。目前已知二倍体生物中具有最多染色体的是心形瓶尔小草,分类学名称是Ophioglossum reticulatum,念起来挺费劲,它有1260条染色体!想起那首歌来了:没有花香,没有树高,我是一棵无人知道的小草……,什么样?来看一看……

好,我们回来看文章。b是与曼氏血吸虫染色体的同源性比较。目的是告诉我们这两者具有共同祖先。c和d是不同方法得出染色体9号是三倍体。接着看文章。
特殊的代谢活动和解毒能力
与其它动物相比,高可信度基因组数据显示多房棘球绦虫具有整体上代谢能力降低以及吸收营养能力增强的特点(图2,3,补充部分9)。多房棘球绦虫的主要能量来源,糖类,可以通过有氧呼吸分解代谢,也可以通过两种补充途径乳酸发酵和苹果酸岐化作用进行分解代谢。已经有实验证实线粒体延胡索酸还原酶抑制剂具有杀死寄生虫的效应,说明苹果酸岐化途径可能成为开发新型治疗方法的有效目标。
绦虫和血吸虫一样没有自我从头合成脂肪酸和胆固醇的能力。它们使用脂肪酸载体和脂类增长酶来从宿主那里获得必需的脂肪,在这一过程中还需要几种绦虫特异性基因家族的参与,比如脂肪酸结合蛋白(FABP)以及载脂蛋白B抗原。对于棘球绦虫后绦幼虫来说脂肪酸的摄取似乎非常重要,因为脂肪酸结合蛋白(FABP)以及载脂蛋白B抗原家族是表达水平最高的基因(补充表5)。绦虫和血吸虫都缺失许多与过氧物酶体相关的基因,过氧物酶体是一种细胞器,脂肪酸的氧化反应在其中发生,所以也许绦虫象其它几种寄生虫那样,连过氧物酶体也一起缺失了。

Figure2 Evolution of tapeworm parasitism.
Phylogeny of the main branches ofBilateria; Ecdysozoa (including fruit flies and nematodes), Deuterostomia(including lancelet, zebrafish, mice and humans), and Lophotrochozoans(including Platyhelminthes (flatworms)) (based on phylogeny in SupplementaryFig. 7.1). The gains and losses of life-cycle traits for these parasiticflatworms include the evolution of endoparasitism (a), passive transmissionbetween hosts (b), acquisition of vertebrate intermediate host (c), ability to proliferateasexually in intermediate host (d). Morphological traits that have evolvedinclude the loss of eye cups (e), gain of neodermatan syncytial epithelia (f),loss of gut (g), segmentation of body plan (h), and changes in the laminatedlayer (to contain specialized apomucins; i). Gains and losses of genomic traitsinclude spliced-leader transsplicing (1), loss of Wnt genes (2), loss of NEK kinases,fatty acid biosynthesis and ParaHox genes (3), anaerobic metabolic abilitythrough the malate dismutation/rodhoquinone pathway, merger of glutaredoxin and thioredoxin reductase to thioredoxinglutathione reductase (TGR)(4), evolution of tapeworm- and fluke-specific Argonaute (Ago) family, microexon genes (MEGs) and PROF1 GPCRs (5), loss of peroxisomal genes (6), andcomplete loss of vasa, tudor andpiwi genes, NF-kB pathway, loss of 24 homeobox gene families (indicated by ‘H’),metabolic proteases and amino acid biosynthesis (7). In tapeworms, gains and lossesof genomic traits include innovation of bimodal intron distribution and novelfatty acid transporters (8), expansion of mu-class glutathione S-transferases, GP50 antigens and tetraspanins (9), loss of themolybdopterin biosynthesis pathway, loss of 10 homeobox gene families (10),fewer GPCRs and fewer neuropeptides encoded by each protopeptide (11), andexpansion of heat shock proteins (Hsp) and species-specific antigens (12).
图2 绦虫寄生活动的进化
双侧对称动物(Bilateria)主要分支的进化史,有蜕皮动物(Ecdysozoa,包括果蝇和线虫),后口动物(Deuterostomia,包括文昌鱼-lancelet,斑马鱼,小鼠和人类)和冠轮动物(Lophotrochozoans,包括扁形虫)。这些寄生性扁形虫获得或缺失生命周期迹象包括内部寄生体的进化(a);宿主间被动传播(b);需要脊椎动物做为中间体(c);在中间体中有无性繁殖能力(d);进化的形态学迹象包括眼杯的缺失(e);新皮肤素合胞体上皮(neodermatan syncytial epithelia)(f);肠道消失(g);体平面分节(h);叠片层发生改变,包含特异性粘蛋白前体(i)。获得或缺失基因组迹象包括剪接前导反式剪接(1);缺失Wnt基因(2);缺失NEK激酶,脂肪酸合成和ParaHox基因(3);通过苹果酸岐化/深红醌途径的无氧代谢能力,将谷氧还蛋白和硫氧还蛋白还原酶融合成硫氧还蛋白谷胱甘肽还原酶(TGR)(4);绦虫和血吸虫特异性Argonaute(Ago)家族的进化,微外显子基因(MEGs)和PROF1 GPCRs (5);过氧物酶体类基因缺失(6);基因vasa,tudor和piwi的完全缺失,NF-kB途径完全缺失,24个homoebox基因家族缺失,代谢性蛋白酶以及氨基酸生物合成(7)。在绦虫中获得或缺失基因组的迹象包括新式双峰内含子分布及新式脂肪酸载体(8);mu-级谷胱甘肽转硫酶,GP50抗原和四跨膜蛋白的扩增(9);钼喋呤生物合成途径的缺失,10个homeobox基因家族的缺失(10),几乎没有前体肽编码的GPCRs和神经肽(11);热休克蛋白-Hsp和种属特异性抗原的扩增(12)。
图二总结 这是一个故事图,重点强调绦虫进化中获得或缺失的特点,没有太多可说的地方,图示说明中将分级标注数字或字母放在后面不太习惯。
与其它动物相比,曼氏血吸虫合成氨基酸的能力降低。在绦虫中这种能力进一步下降,多房棘球绦虫没有丝氨酸和脯氨酸生物合成需要的酶(图3,补充部分9)。多房棘球绦虫钼喋呤生物合成途径上的许多酶似乎缺失了,还有那些使用钼喋呤作为辅助因子的酶类。我们曾相信在所有动物体内都有在酶促反应中使用钼的能力,但这种能力在一些真核寄生虫中缺失了。
绦虫与其哺乳动物宿主之间解毒系统的差异可以用来进行药物设计(补充部分9)。我们发现,绦虫像血吸虫那样,只有一个细胞色素类基因P450,说明它们氧化诸如药物,杀虫剂等外来物质以及固醇类物质的能力低于它们的宿主。非常具有特异性的是,绦虫和血吸虫都将两个氧化还原反应的关键酶融合形成一个单一的酶:硫氧还蛋白谷胱甘肽还原酶(TGR)。TGR是绦虫和血吸虫的必需基因,而且已证实可以作为治疗血吸虫的药物目标。在TGR下游,我们发现了超出预料的硫氧还蛋白的多样性,包括谷氧还蛋白以及μ类谷胱甘肽转硫酶(GSTs)(补充表9)。谷胱甘肽转硫酶类的扩展说明绦虫具有将很大范围内疏水性化合物进行水溶性处理以及排泄这些化合物。
同源盒基因缺失
同源盒基因是动物中与形成体平面模式相关的高水平转录因子。在寄生型扁形虫中,同源盒基因的基因数量大规模减少(补充表10)。大多数双侧对称无脊椎动物中都含有一组保守的大约有100个同源盒基因(比如线虫有92个,果蝇有102个,文昌鱼有133个)。在起源的双侧对称动物中一般认为有96个同源盒基因,血吸虫少了24个,而绦虫又比血吸虫少了10个,是已知双侧对称动物中同源盒基因数最少的。绦虫特异性缺失的基因主要是与神经系统发育相关的基因家族(mnx,pax3/7,gbx,hbn和rax)。虽然绦虫的感觉传输和颅化发育较差,但它整体还是具有发育良好的神经系统,因此我们对这一现象感到惊异。绦虫也缺失ParaHox 基因(gsx,pdx,cdx),这些基因是进化初始原肠形成有关基因,虽然似乎在绦虫进化肠道消失之前这些基因就已经缺失了。其他在双侧对称动物进化途径中保守的基因如Hedgehog和Notch在绦虫中都存在而且很完整,但与之相比,其祖先的螺旋卵裂类(spiralian)具有12个Wnt的配体而绦虫Wnt的配体则大大地减少了(补充表10)。
干细胞的特异化
由于扁形虫拥有一直存在的体细胞性干细胞(新生未分化细胞),因此具有极强的再生能力以及多变的发育能力,也是干细胞研究最受欢迎的模型。所有多细胞生物都依赖其干细胞进行增殖生长,因此当我们发现绦虫和血吸虫没有普遍拥有的干细胞标示基因vasa时感到很惊讶(补充部分11)。绦虫具有另一个死盒RNA解旋酶两个拷贝,我们认为其具有部分vasa的功能(补充图11)。绦虫和血吸虫都缺失piwi基因亚家族,我们发现绦虫具有一个舡鱼蛋白(argonaute protein)新亚家族(补充图11),其成员可能与新发现的小RNA前体结合。通常情况下,基因piwi和vasa是调控动物生殖干细胞分化所必需的,而抑制vasa将导致不育或者死亡。这些发现说明在寄生性扁形虫中干细胞相关的途径可能被大大改变了。
(那什么,先喝口水,科研一定要紧跟形势,你研究的对象可能不太火,可你研究的内容要火,像这篇绦虫测序,讲故事选干细胞就是个例子。06年以后干细胞大火,所以在这儿也有这么一段儿。对了,这段里有个挺好玩儿的词,argonaute protein,我翻成舡鱼蛋白,这是一个家族,与RNA结合,起基因沉默(gene silencing)作用。说它好玩儿有几点:第一,怎么起了这么个名?跟鱼有关系么?嗯,有点。98年有人研究拟南芥,对,就是那个小草,前几周有篇Nature Article介绍过,发现在拟南芥中某个突变发生后,小草的叶子形态大大改变,卷曲伸长,像鱿鱼的触手一样,这位老兄显然不是美事家,要不就把这种突变叫鱿鱼了。他觉得突变像一种argonaute,其实就是舡鱼,一种头足纲动物,和章鱼鱿鱼有点亲缘关系。他把发生这种突变的蛋白叫argonaute protein,我翻译成舡鱼蛋白。第二,这个舡鱼本身挺有意思,历史很长,当年亚里士多德有过关于它的记载。它自身能长出贝壳样的东西,可以保护自身,还充当浮水的工具。大概由于其特殊神秘以及非常好的潜水技能,1954年美国第一艘核潜艇就命名为舡鱼号,虽然英文名字不同,核潜艇用的是“nautilus”,其实是同一种动物,或者精确点说argonaute是 nautilus 中的一种。汉语还有一个更富有诗意的名字大概听说过的人就多了,叫鹦鹉螺。第三,这个舡鱼你知道汉语怎么念么?钢鱼?不对!僵鱼?不对!工鱼?不对!它叫“船”鱼。什么?还不如叫鹦鹉螺?一看就不是专业人士,我们要具备专业人士的态度,建议少用鹦鹉螺这样太大众化的称呼,特别是像Nature Article这样专业的文章!好了,下面看图3。)

Figure 3 | Conservation of individual metabolic pathways. Heatmap showing the conservation of individualmetabolic pathways for E.multilocularis (Em), E. granulosus (Eg), T. solium (Ts),H.
microstoma (Hm)and S. mansoni (Sm) compared to those of humans(Hs) and mice (Mm). Each row indicates an individual metabolic pathway grouped bytheir super class membership (defined by KEGG (Kyoto Encyclopedia of Genes andGenomes)). Coloured tiles indicate the level of conservation (percentage ofenzymes detected) of each pathway within each species. KEGG pathways with insufficientevidence (that is, containing only one enzyme) in E. multilocularis have been removed.
CoA, coenzyme A; EC, enzyme commission number; TCA, tricarboxylicacid cycle.
图3 代谢各途径的保守性比较
热图显示四种绦虫以及曼氏血吸虫与人和小鼠的各个代谢途径的保守性比较。每一行表示一个代谢途径(由京都基因及基因组百科全书定义)。色块表示保守程度。
图3总结,没什么可说的,绦虫和人只有糖代谢部分一致性很高,还有一个就是绦虫和人的叶酸生物合成途径一致性也很高,后面分析到如何利用不同来设计药物。
绦虫蛋白质组的特异性
我们在绦虫中寻找新的还有扩大的基因家族的过程中注意到,绦虫中存在许多与细胞细胞间黏附以及外皮形成相关的新的结构域(补充部分8)。比如,在绦虫钙粘蛋白(cadherin)外功能区发现了几个新结构域(补充部分8),还有在四旋蛋白方面,绦虫比已经高度扩增的果蝇和斑马鱼具有比例更高的拷贝数,达30-36个(补充表12)。包被棘球绦虫外壳的胞外多糖基质层是唯一具有种属特异性的物质,甚至是在亲缘性很近的种属之间比如狗绦虫和多房棘球绦虫之间也不同。我们通过一种棘球绦虫特异性粘蛋白前体(apomucin)确认出不同种属之间的区别(补充图12),apomucin这种粘蛋白前体是基质层重要的组成成分。一个特殊的拷贝在两个种属间形成很大的分化差异(非同义置换与同义置换的比例高于1)而且是棘球绦虫幼虫期第五个高表达的基因(补充表5)。在基质层中半乳糖是主要的组成成分,而可以使用半乳糖对基质层中粘蛋白前体apomucin进行修饰的半乳糖苷转移酶同样发生了种属间的分化(补充部分8)。绦虫中20%的基因是绦虫特有的,其中包括许多高表达抗原家族,比如抗原B,糖基化磷脂酰肌醇锚定蛋白(GPI-anchored protein)GP50,以及疫苗目标蛋白EG95(补充表12)。
在绦虫基因组中最让人惊异的是热休克蛋白70(Hsp70)家族的扩增。系统进化分析表明在绦虫中存在Hsp110和细胞质类Hsp70两种相互独立平行的扩增(图4)。已知Hsp70在其他系统中存在扩增的例子,包括Hsp110在牡蛎中的扩增(温度影响下)以及在癌细胞中的扩增(蛋白毒性应激条件下)。棘球绦虫和猪肉绦虫在细胞质类Hsp70进化分枝上具有最多的基因扩增数。这种扩增似乎在各个种属中具有独立性,棘球绦虫和猪肉绦虫每个种属大约有22到32个完全的拷贝,而果蝇中是6个,人中是2个(图4)。这一扩增的进化分枝不具备传统细胞质类Hsp70的特点(指结合底物的保守性EEVD基序以及GGMP重复片段),而当传统性Hsp70在绦虫各发育期一直表达时,非传统的Hsp基因几乎没有表达,说明扩增家族充当应付特殊情况的角色,只在一定条件下才进行高表达(补充图12)。棘球绦虫中至少40%hsp-70类基因存在于染色体亚端粒区,包括8号染色体的极端情况:8个拷贝(包括假基因)全都处于染色体亚端粒区中(补充表12)。在这些区域中没有其他基因过量出现。虽然在绦虫排泄分泌物中有Hsp70,但非传统的Hsp是否在与宿主的相互作用中起作用以及与端粒之间的近距离是否影响其表达和功能都有待进一步研究确证。

Figure 4 | Heat shock protein70 expansions in tapeworms. Rootedtree of Hsp70 sequences from tapeworms and the eight comparator species used inthis study, with additional sequences from baker’s yeast Saccharomyces cerevisiae, and the Pacific oyster Crassostrea gigas (a non-flatworm example of a lophotrochozoanwith a recently reported Hsp70 expansion). Different Hsp70 subfamilies areshown in different colors. Dotted red lines, E. multilocularis hsp70 genes that are located in the subtelomeres. EEVD, the conservedcarboxyterminal residues of a canonical cytosolic Hsp70; ER Hsp70, endoplasmic reticulumHsp70.
图4 绦虫热休克蛋白70的扩展。Hsp70序列有根图,包括绦虫及其他8种比较生物,还有酿酒酵母和太平洋牡蛎。不同Hsp70亚家族使用不同颜色标示。红色虚线表达绦虫hsp基因位于亚端粒区。EEVD,传统细胞质类Hsp70保守性羧基残基;ERHsp70,内质网Hsp70。
图4总结,这是一个有根树图,进化中最常见的分析进化关系的表示方法,基于序列比较和算法设计,其意义是通过计算对其它物种或因素影响进行进化预测。
新的药物目标
绦虫包囊性疾病一般通过化疗或手术进行治疗,取决于绦虫种类,患者健康状况以及囊肿位置。唯一被广泛使用治疗绦虫的药物是苯并咪唑(benzimidazole),由于这种药物的副作用,因此使用时一般在抑制(parasitistatic)浓度而非杀虫(parasiticidal)浓度。因此急需新的药物目标以及化合物。
为确认新的可能的药物目标,我们首先对目前制药已知的目标进行了调查,包括激酶,蛋白酶,G蛋白偶联受体以及离子通道。我们在绦虫中确认了大约250到300种新的蛋白激酶(补充表13),这些激酶包括大多数类型(补充部分13)。我们在棘球绦虫中还确认了151种蛋白酶和63种类肽酶蛋白,其多样性与曼氏血吸虫相似。我们发现与其他动物相比,棘球绦虫中的拷贝数大大减少(补充表13)。许多有效的肠驱虫药是作用在几种不同神经传输形式之一,因此我们制作了绦虫的5-羟色胺和乙酰胆碱神经递质信号传输途径图谱,预测了其中的保守的和新的神经多肽(补充表13),对60个以上的GPCRs和31个配体门控离子通道进行了分类(补充表13)。一种电压门控钙离子通道亚基-治疗血吸虫病的药物吡喹酮(praziquantel)的作用目标-在绦虫囊肿中并不表达,这解释了用吡喹酮治疗绦虫的低效性。
我们搜索数据库来寻找可以用于目标筛选的性质,包括临床相关的绦虫幼虫期蛋白目标及表达相关性化合物,通过使用这些信息对整个绦虫蛋白组进行评估。我们在棘球绦虫中确认了1082个蛋白作为可能目标,其中150到200个最高分的具有化学物引导(已知药物或已批准的化合物)。
甲氟喹是一种抗疟疾的药物,它可以减少曼氏血吸虫的排卵量,它也可以抑制乙酰胆碱酯酶,乙酰胆碱酯酶是可能性目标中排名比较靠前的。但在绦虫囊肿乙酰胆碱酯酶的转录活动很弱,也许这样会限制它们的适用性。通过移出具有共同底物而不是抑制剂来排除目标的方法筛选,得到的名单中前几位包括几种癌症化疗目标的同源物,像酪蛋白激酶II,核糖核苷酸还原酶,UMP-CMP激酶以及蛋白体亚基(表1)。通过药物抑制肿瘤和绦虫幼虫的挑战某种程度上说很相似,二者都是不受控制的繁殖,侵袭和转移,都在不伤害周围环境的前提下很难杀死。因此,对绦虫采用的攻击手段也会像癌症那样;抑制有丝分裂,诱导细胞凋亡以及阻止DNA复制。事实上,驱肠虫剂灭绦灵(niclosamide),甲苯哒唑(mebendazole)和阿苯哒唑(albendazole)已经显示出具有抑制肿瘤生长的能力了。

结论
绦虫是我们所知最早的人类寄生虫,大约公元前300年希波克拉底(Hippocrates)和亚里士多德(Aristotle)都有记载,但直到今天,我们仍然没有安全有效的方法来治疗绦虫幼虫对人类的感染。这些基因组提供了几百种可能的药物目标,这些目标可以通过高通量筛选的方法来验证,最近发展的无共生细胞培养技术可以用来建立有效的筛选方法。扁形虫展示了独特的高度可变的发育特点。在本研究中,高水准序列的完成使基因丧失或获得都可以准确地判断出来,显示了在绦虫进化过程中是如何应用这些可塑性的。
(全文完,原文及补充材料在附件中)
最后编辑于 2013-04-09 · 浏览 3975