dxy logo
首页丁香园病例库全部版块
搜索
登录

【转帖】人类基因表达图谱在肿瘤研究中的作用!

最后编辑于 2022-10-09 · IP 陕西陕西
2211 浏览
这个帖子发布于 23 年零 42 天前,其中的信息可能已发生改变或有所发展。
江宁 李桂源
湖南医科大学肿瘤研究所(410078)

  

摘 要

  通过表达序列标志( EST )测序、 SAGE 分析和 cDNA 杂交等方法,人们已构建了十分详细的基因转录图谱,获得了有关人类基因组编码序列及表达时空的资料,在人类肿瘤致病基因的克隆鉴定功能分析以及全面了解肿瘤发展过程的分子基础发挥了重要作用。大量 EST 的获得为定位候选克隆法提供了候选基历的标志,为克隆到的基历片段提供了相关资料,并且成为把模式生物基因组的研究成果运用到人类肿瘤研究的桥梁;通过构建肿瘤基因表达差异图谱,人们可以全面了解肿瘤发生发展过程中的基历表达改变。

关键词 * 基因表达图谱;肿瘤;人类

  人类基因组计划( human genome project) 自 1987 年提出以来,已取得了非凡的成果。已经获得高分辨的人类染色体遗传连锁图谱和物理图谱、并预计不久将彻底破译人类基因组中 3 × 109 个碱基对。然而,寻找基因组 DNA 中的编码序列,了解它们表达的时空方式,构建疾病的基因表达谱并克隆新的疾病相关基因与了解基因组 DNA 的序列同等重要。于是直接从 cDNA 出发,测定 cDNA 克隆的部分序列,检测 cDNA 表达的数量及在组织细胞中和分化发育过程中的表达特异性,绘制精细的人类基因表达图谱已成为紧迫任务。

1 人类基因表达图谱的构建进展

  最初的人类基因表达图谱的构建是从以表达序列标志( Expression sequence tag, EST )测序方法为基础以获得大量 EST 开始的。 Adams 提出了 EST 的概念和构建以 EST 为界标的人类基因组表达图谱的计划 [1] ,所谓 EST 即一个 cDNA 克隆的 3' 端或 5' 端已测序部分,每个 EST 的长度为 150bp ~ 500bp ,类似干 STS ,随机分布在染色体上,每个 EST 代表一个单拷贝的 cDNA 表达序列,成为人类寻找新的未知基因和克隆致病基因的可识别标志。

  EST 测序和 EST 的获得随着大规模自动测序的发展而发展。从 cDNA 文库中随机挑取 cDNA 克隆,采用载体上的序列作为测序引物,运用双脱氧链终止法对每个克隆进行单向部分自动测序。 cDNA 测序的结果中包含许多序列上重叠的 ESTs ( Expression sequence tag sequen) ,将这些 ESTs 归于同一 EST ,认为它们来源同一 cDNA 。 CDNA 测序以每天增加 1500 个 CDNA 序列的速度在迅速进行,迄今为止,已获得了 500 000 个人的 ESRs 初步估计代表约 50 000 ~ 100 000 个基因,可以说人类绝大部分的基因已有相应的 EST 序列,它们已全部输到 intnet 网中,查找十分方便 [2~4] 。

  运用 PCR 可以迅速检测 EST 的存在和数量。选择 cDNA 的 3' 端非翻译区( 3 ’ UTRs )设计 PCR 引物进行 PCR 扩增,因为( 1 )它几乎不包含内含子,无论以 cDNA 应是基因组 DNA

  为模板扩增所得的 PCR 产物长度都是一致的。( 2 ) 3'UTRs 区域相比那些编码区而言保守性低,容易把单个基因从基因家族的成员中区分开来,并且在运用 PCR 方法结合人鼠杂种细胞板定位 EST 时不易扩增出小鼠的基因组 DNA[5,6] 。与 cDNA 测序所获得的 ESTs 数量相比, ESTs 的定位则显得进展缓慢。尽管从传统手工的荧光原位杂交技术一采用以 PCR 为基础的人鼠杂种细胞板技术定位 Esrs 于染色体水平一以 CEPH YAC 库中大片段 DNA 为模板把 ESTs 定位于染色体的相应区带,方法学的不断更新使得 ESTs 的定位从速度和精细方面有所提高,但仍不尽人意 [7,9] 。随着染色体的物理图谱和遗传图谱日益精细, EST 的定位工作正在加速。

  目前已发明了许多更快捷的方法来研究 cDNA 在组织、细胞中的表达情况。一方面通过检测 cDNA 分子中的 SAGE 位标出现的频率来确定 SAGE 位标所代表的基因是否表达以及它们的表达水平 [10] ,所谓 SAGE 位标是来源于被检测基因同一位置的一段 9bp 序列 [ 一段 9bp 的序列可以区别 262144 ( 4 9 )个基因 ] ,可以由锚定酶和位标酶切割 cDNA 分子的特异位置产生,然后连接几十个位标、克隆、测序,即可快速构建在特定组织、细胞中,在特定发育状态下的 cDNA 表达图谱。

  另一方面,采用杂交的方法可以在短期内检测基因在不同组织、细胞、发育状态、病理状态下的表达差异 [11] 。从 cDNA 文库中挑选单个克隆人工或机器点在尼龙膜或显微微镜玻片上,与来源于特定组织或细胞的 cDNA 探什杂交,利用图象分析系统分析杂交结果,采用启动测序仪来测定感兴趣的克隆的序列以确定表达有差异的基因。

2 人类基基表达图谱在肿瘤研究中的作用

2.1 大规模 cDNA 测序和 EST 的产生为克隆和鉴定肿瘤致病基因提供了快速而准确的途径。

2.1.1 EST为定位候选克隆肿瘤致病基因提供了丰富基因标志:

  在克隆许多肿瘤致病基因过程中采用的是传统的定位克隆方法,即通过家系分析法或 LOH 分析把这些基因定位于染色体上的特异区带,采用染色体步移或跳步获取覆盖这一特定的 DNA 克隆群。在此基础上运用外显子捕获法( Exon trapping )、杂交吸附筛选法( Direct se1ectlo )、寻找 CpG 岛等方法获取候选基因的 cDNA 序列;进一步检测候选基因在受累组织中改变情况。

  这一方法目的性极强,需要消耗大量精力用于文库筛选和序列测定,基于这一缺陷,提出了定位候选克隆策略 [5] ,即一旦把某致病基因定位于染色体上某一区带,就可以通过计算机搜寻所有定位于这一区域的已知基因、 EST 、 cDNA 片段作为该致病基因的候选基因,检测这些基因在受累组织、细胞中的改变情况就可以很快地找到致病基因。人类基因组中约有 50000 ~ 100 000 个基因,而已克隆的基因仅 10000 个左右,已定位的仅 4000 ,因此是大规模 cDNA 测序获取大量的 ESTs 并定位才使得定位候选克隆的方法广泛应用起来。运用这种策略成功地克隆了 DPC 4 .抑瘤基因 [6] “通过检测鼻咽癌 LOH 高发频率区 7q32 区域内 20 个 EST 在鼻咽癌和正常鼻咽上皮中的。表达差异成功地筛选到了一个新的抑瘤基因候选者 NPCS1 ,该基因在正常鼻咽上皮中表达强烈而在 30.7 %的鼻咽癌活检组织中不表达或表达极其微弱,并且在 29.1 %的鼻咽癌活检组织中有等位基因的丢失,目前正在测定该基因的全长 cDNA 序列并研究其功能。

2.1.2 EST能为克隆到的片段基因提供相关资料:

  一旦通过某种方法得到了致病基因的一小段cDNA片段后,同样可以通过搜寻数据库找到与之匹配的ESTs,获取有关序列、定位、组织器官表达特异性、是否存在家族成员等资料,并可通过I.M.A.G.E consortium[12]得到包含该ESTs的cDNA克隆。EXT2基因[13](一种从遗传性多发性外生骨疣克隆出来的肿瘤抑制基因)和MADR2基因[14](MADR家族成员,有肿瘤抑制作用,在结肠癌中有突变)的克隆就得益于这些EST的相关资料。

2.1.3 EST是把模式生物基因组研究的成果运用到人类肿瘤研究的桥梁 :

  模式生物基因组,酵母、线虫、果蝇、小鼠,它们基因组比人的要小,但与人的基因组存在着基因结构的同源性,特别是小鼠的基因组与人类基因组存在非常多的可比性。另外它们还有一个得天独厚的优点是人们可以任意操作或改变它们的基因组,因此在研究基因功能方面有着无可比拟的优势并取得了大量的成果。如何把从这些模式生物基因组的研究成果运用到人类肿瘤研究中来, EST 数据库在这方面发挥了巨大的作用。

  一旦人们在小鼠中找到了某个肿瘤致病基因后、可以马上搜寻数据库找到人类基因组中与之同源的基因或 EST 迅速拿到人类基因组中该肿瘤致病基因的全长 cDNA 序列。克隆人类 TSG101 肿瘤敏感基因是运用该策略最典型的例子。 Li 和 Cohen[15,16] 采用一种新的基因克隆方法:随机纯合子敲除法( Random Homozy-gous knock out , RHKO )从小鼠纤维母细胞中找到了具有抑瘤功能的 TSGI01 基因,运用 BLAST 程序在 dbEST 数据库中搜寻与 1448bp 小鼠 TSG101 cDNA 同源的 EST ,得到了与之有 85 %~ 95 %同源的 10 个人类部分 cDNA 序列,把这些序列拼接后发现它们来源于同一 cDNA 。通过 cDNA 克隆测序获得了 1494bp 人类 TSGl01 cDNA 的全序列,并把它们走位于 11p15 . 2 一 15 . 1 ,这是一个在乳腺癌中有高频率 LOH 发生的区域,进一步检测发现: 46.4 %( 7 / 15 )的乳腺癌中存在该基因的部分缺失。

2.2 肿瘤差异表达图谱的构建有助于全面了解肿瘤发生的分子机理

  在恶性肿瘤与其相应的正常组织中存在许多基因表达的差异,克隆这些有表达差异的基因不但可以全面了解肿瘤发生的分子机理,寻找新的肿瘤相关基因及临床诊断和预后的指标,而且能帮助找到新的肿瘤相关基因。从组织和细胞的 cDNA 出发来寻找表达有差异的基因可以使这一研究更加快速、全面。

  直接差异 cDNA 测序法( Direct differentia1 cDNA sequencing )就是在此基础上发展的一种寻找差异表达基因的方法。首先构建肿瘤组织和配对的正常组织的 cDNA 文库并进行 DNA 部分测序获得大量的 ESTs ,然后利用计算机分析、归类,比较统计出每个单一 EST 在肿瘤组织和正常组织 cDNA 文库中存在的数量并找出数量悬殊的 EST ,以此为线克隆出乳腺癌表达特异性基因 BCSG1[17] 。该基因的过度表达预示着良性乳腺肿瘤向恶性转化或原位癌向高度浸润的乳腺肿瘤转化。

  采用差异杂交的方法对胰腺癌和正常胰腺上皮分析发现:大约有 4 %的 cDNA 文库克隆中包含有优先在胰腺癌中表达的序列,其中有 32.5 %代表未知基因, 26.3 %与 EST 数据库中的序列同源,其余的与已知序列同源。通过这一研究第一次全面了解了胰腺癌发展过程中的基因表达改变,为克隆新的瘤基因和致病基因提供了帮助 [11] 。

  采用 sAGE 方法对结肠上皮和结肠癌组织中的 303 706 个转录产物进行分析、鉴定,发现它们代表 49 000 种不同的基因转录产物,找到了 789 种转录产物在正常结肠上皮和原发性结肠癌中表达有显著差异(表达水平相差 10 ~ 13 倍以上), 181 种在结肠癌中表达下调, 108 种在结肠癌中表达上升。此外通过对结肠癌细胞、正常结肠细胞、胰腺癌等进行 SAGE 分析,可以更进一步确定差异表达是细胞自发性的还是依赖于肿瘤微环境,是细胞特异性的还是肿瘤特异性的 [18] 。

  由此可见,把人类基因组计划特别是基因表达图谱的成果运用到肿瘤学的研究中有着巨大的潜力。可以预见,随着基因表达图语的进一步完善,方法学的不断创新,将大大推动肿瘤致病基因的克隆、分离、功能鉴定和肿瘤发生的分子机理研究。

参考文献

01 Adams MD et al. Natrue, 1992; 355: 632-634
02 Boguski MS et al. Nat Genet, 1995; 10: 369-371
03 Adams MD et al. Nature, 1995; 377 (suppl): 3
04 Adams MD et al. Genet, 1993; 4: 373-380
05 Colins F. Nat Genet, 1995; 9: 347
06 Hahn SA et al. Science, 1996; 271: 350-353
07 Wilcox AS et al. Nucleic Acids Res, 1991; 19(8) : 1837
08 Berry R et al. Nat Genet, 1995; 10:415
09 Polymeropoulos MH et al. Nat Genet, 1993; 4: 3810
10 Velculescu VE et al. Science, 1995; 270: 484-487
11 Gress TM et al. Oncogene, 1992; 13: 1819-1830
12 Lennon GG et al. Genomics, 1996; 33: 151-152
13 Sticken D et al. Nat Genet, 1996; 14: 25-33
14 Eppert K et al. Cell, 1996; 86: 543-552
15 Li LM et al. Cell, 1996; 85: 319-329
16 Li LM et al. Cell, 1997; 88: 143-154
17 Ji HG et al. Cancer Res, 1997; 57: 759-764
18 Zhang L et al. Science, 1997; 276: 1268-1272













































































1 2 点赞

全部讨论(0)

默认最新
avatar
1
分享帖子
share-weibo分享到微博
share-weibo分享到微信
认证
返回顶部