词条 | 垃圾DNA |
释义 | 简介酵母和蠕虫之类的简单生物是如何进化为鸟和哺乳动物这样的复杂生物的呢?一项针对基因组进行的广泛比较研究显示,问题的答案可能就隐藏在生物的垃圾脱氧核糖核酸(DNA)中。美国科学家发现,生物越复杂,其携带的垃圾DNA就越多,而恰恰是这些没有编码的“无用”DNA帮助高等生物进化出了复杂的机体。 科研背景自从第一个真核生物——包括从酵母到人类的有细胞核的生物——的基因组被破译以来,科学家一直想知道,为什么生物的大多数DNA并没有形成有用的基因。从突变保护到染色体的结构支撑,对于这种所谓的垃圾DNA的可能解释有许多种。但是去年从人类、小鼠和大鼠身上得到的完全一致的关于垃圾DNA的研究结果却表明,在这一区域中可能包含有重要的调节机制,从而能够控制基础的生物化学反应和发育进程,这将帮助生物进化出更为复杂的机体。与简单的真核生物相比,复杂生物有更多的基因不会发生突变的事实无疑极大地强化了这一发现。 为了对这一问题有更深的了解,由美国加利福尼亚大学圣塔克鲁斯分校(UCSC)的计算生物学家David Haussler领导的一个研究小组,对5种脊椎动物——人、小鼠、大鼠、鸡和河豚——的垃圾DNA序列与4种昆虫、两种蠕虫和7种酵母的垃圾DNA序列进行了比较。研究人员从对比结果中得到了一个惊人的模式:生物越复杂,垃圾DNA似乎就越重要。 这其中暗含的可能性在于,如果不同种类的生物具有相同的DNA,那么这些DNA必定是用来解决一些关键性的问题的。酵母与脊椎动物共享了一定数量的DNA,毕竟它们都需要制造蛋白质,但是只有15%的共有DNA与基因无关。研究小组在7月14日的《基因组研究》杂志网络版上报告说,他们将酵母与更为复杂的蠕虫进行了比较,后者是一种多细胞生物,发现有40%的共有DNA没有被编码。随后,研究人员又将脊椎动物与昆虫进行了对比,这些生物比蠕虫更为复杂,结果发现,有超过66%的共有DNA包含有没有编码的DNA。 参与该项研究工作的UCSC计算生物学家Adam Siepel指出,有关蠕虫的研究结果需要慎重对待,这是由于科学家仅仅对其中的两个基因组进行了分析。尽管如此,Siepel还是认为,这一发现有力地支持了这样一种理论,即脊椎动物和昆虫的生物复杂性的增加主要是由于基因调节的精细模式。 西雅图华盛顿大学的分子生物学家Philip Green对此表示同意。他说,“这一研究成果令人信服。”但他同时强调,对所有未被生物共享的没有编码的DNA的研究依然没有定论。 参考资料:自美国<医学研究> 静悄悄的革命:重认识“垃圾”DNA片段 相关报道在收集、研究了130个国家的智商测试数据后,英国阿尔斯特大学名誉教授理查德·林恩得出了一个大胆结论:中国人、日本人、朝鲜人拥有全世界最高的智商,平均值为105。作为东亚人当然愿意相信林恩教授的研究结果,但是他的结论却引发了包括种族歧视等话题的争议。 牛津大学的科学家最近发现了一种与细胞分裂密切相关的基因调控机制,这种机制与在细胞核中的某种RNA有关,它的作用以前不为人知。这项发现可能为阻止癌细胞扩增提供启示。 众所周知,RNA在蛋白质的合成中扮演了重要的角色,但是科学家们很久以来就知道并不是所有种类的RNA都与蛋白质合成直接有关。由英国医学研究理事会(MRC)和Wellcome基金会资助的一项研究表明,某一类RNA对基因的调控起重要作用。该发现在线发表在《自然》上。 人类基因组工程确定了大约三万四千个与蛋白质制造有关的基因。而其余的基因片段——也就是大多数基因——被认为是由所谓的没有功能的“垃圾”DNA片段组成的。但是最近几年的研究发现这些所谓的“垃圾”DNA产生了大约50万种RNA,只不过这些RNA的功能还未被发现。 牛津大学的高级研究员、该研究项目的负责人AlexandreAkoulitchev博士说:“在过去几年里,生物学界正在悄悄发生着一场关于革命,人们对于RNA的角色开始有了新的认识。科学家们开始发现这些所谓的“垃圾”DNA片段其实极其重要,由它们制造的RNA种类数量非常惊人,它们的潜在意义非同寻常。” Akoulitchevv研究组特别感兴趣的是RNA与一种名为二氢叶酸还原酶基因(DHFR)的调控密切相关,能决定该基因的开合状态。DHFR基因产生的一种酶能够控制胸腺嘧啶,而胸腺嘧啶对快速分裂的细胞很重要。抑制DHFR基因能够有效阻止癌细胞的扩增。 生物学家们在很长一段时间里都认为,既然几乎所有具体的生理机能都要由蛋白质来完成,那么不编码蛋白质的DNA应该是没有用的,可以称为“垃圾DNA”。 到今年,DNA双螺旋结构向人类展现其本来面目已有52年了。似乎人类已经绘出包括自身在内的许多物种的基因组图谱。但最新一期《科学世界》杂志却撰文指出,平日充斥于学术论文和新闻媒体的“基因”只是生命之书中一些极小的段落。基因组绝大部分区域仍然潜藏在暗影中,长久以来被人们当成“垃圾”而忽视,只在近年来才露出几缕光芒,显示这个巨大的“垃圾场”可能蕴藏着与其体积相称的宝藏。 以垃圾的名义人类基因组草图绘制完成后,23对染色体、30亿个碱基对这样的常识也开始为非专业人士所熟知,人类对自身遗传图谱的认识得到了很大的补充与修正。大概在2000年时,科学家还估计人类基因组中约有10万个基因,但不出5年这一数字已跌到2万个至4万个,目前一种比较通行的说法是约2.5万个。这些基因所包含的DNA序列,大概只有人类基因组序列总长的2%左右。也就是说,人类生命蓝图中约有98%的信息似乎不属于什么基因,是无用的垃圾。然而,什么是基因垃圾呢? 地球上绝大多数生命以DNA为遗传物质,另有一些病毒使用RNA,没有别的方案——为什么是这样,科学家并不知道。他们急于寻找外星生命,哪怕只是细菌也好,一个重要原因就是想看看地球生命使用DNA是偶然还是必然。DNA由4种碱基也就是4种“字母”组成,分别称为A、T、C、G。在RNA中,字母T被换成了U。整个DNA双螺旋就像一条极长的、扭曲的梯子,梯子的两边各是一条由许多字母逐个连接而成的带子,每个字母与对面带子上相应位置的字母结合在一起成为一个梯级,称为“碱基对”。其中,只能A、T相互结合以及C、G相互结合,所以知道了DNA双链中一条的碱基顺序,另一条也就确定了,这两条链是互补的。 生物的遗传信息,就是DNA链上这些字母的排列方式。将蓝图转化为实际产品的过程,就是一段DNA根据其碱基序列合成出对应的RNA序列(转录),然后RNA序列信息指导氨基酸拼合形成蛋白质(翻译)的过程。生物体的生理机能,基本上都由蛋白质来完成,比如在血液中运送氧气、进行新陈代谢等等。可以说,DNA发出命令、RNA挥动鞭子,而蛋白质则是卖苦力的牛马。从DNA到RNA再到蛋白质的这个过程,就是生物学的“中心法则”。 能够最终形成蛋白质或者说“编码某种蛋白质”的这样一段DNA,就是我们传统意义上所说的“基因”。在人和其他生物体内,这样的基因都只占整个基因组的很小一部分,它们就像宝石一样零星地落在黑沉沉的荒野中。各基因之间是大片大片不能制造蛋白质的DNA序列,即“非编码序列”。生物学家们在很长一段时间里都认为,既然几乎所有具体的生理机能都要由蛋白质来完成,那么不编码蛋白质的DNA应该是没有用的,可以称为“垃圾DNA”。 基因的墓场一集50分钟的电视剧被拆成好几节来播放,中途插入的广告总共算起来有半小时以上,是否已经让你忍无可忍?那么,假如给2分钟的正经节目配上98分钟的广告,你会有什么感觉?是的,太过分了!生命为何要如此浪费?除了性细胞,人体每个细胞里都有一整套DNA,每套DNA只有约2%的内容有用。在其他哺乳动物体内,比例也大抵如此。有些物种的基因组更加“精练”、垃圾更少,比如鸡的基因组大小只有人类的1/3、河豚则为人类的1/10,但它们的基因数量却与人类差不多。也有的更夸张,如洋葱的基因组有人类基因组的12倍那么大、阿米巴变形虫的基因组更是比人的基因组大200多倍。 人们对垃圾DNA的来源提出了多种解释,比如有一部分垃圾来自病毒。逆转录病毒是一类以RNA为遗传物质的病毒,其中我们最熟悉的是艾滋病病毒。它们侵袭宿主细胞时,会把自身的RNA转换成DNA插入基因组中,并跳来跳去大量复制。从DNA到RNA的过程叫转录,反过来就叫逆转录,这也是这类病毒的名称由来。逆转录病毒有的会致病、引起艾滋病或癌症等,也有的没有什么影响。在进化历程中,有许多逆转录病毒DNA留在了人类基因组里而成为垃圾。 还有一些垃圾DNA可能是死亡基因的遗骸,被称为“假基因”。科学家认为,它们原本是编码蛋白质的真基因,由于发生变异而失去功能被弃之不用。它们的序列与真基因非常相似,但有着细微差别,正是这些差别使假基因不能编码蛋白质。去掉假基因不会影响有机体的功能,偶尔某个假基因发生变化、死而复生倒可能造成麻烦。由于假基因的存在不增加或减少生物的生存优势,所以进化过程很难把它们从基因组里清除出去,就好像把东西扔到了垃圾桶里却没有人把垃圾桶拿出去清倒,结果在屋子里越积越多一样。假基因在生物基因组中大量存在,人体内就有约2万个,几乎与真基因的数量相当。 有证据显示,至少一部分垃圾DNA很像真正的垃圾,因为动物失去它们之后依然生活得很好。2004年10月,一组美国科学家在《自然》杂志上发表报告说,他们删除了小鼠基因组中超过100万个碱基对的非编码DNA(约占鼠基因组的1%),但并没有对这些小鼠的发育、寿命和繁殖造成可察觉的影响。在100多项评估基因活性的组织测试中,只有两项发现了差异。他们还培育出失去300万个碱基对的非编码DNA小鼠,也没有发现明显异常。 “基因”定义要重写然而,这并不是全部。在过去几年中,分子生物学家们已经越来越感觉到,“垃圾DNA”的命名过于草率了,连“基因”的定义也需要重写。编码蛋白质并不是DNA的全部意义,那些非编码区域也许有一部分像上面的试验所显示的那样没有明显功能,但更多的部分我们还不了解,不能先入为主地将它们扔进垃圾堆。实际上,那一大堆“垃圾”里已经长出了一些让科学家眼花缭乱的东西,而这还只是冰山之一角。 比如,理论上完全无用的假基因并不是那么“假”,2003年,一个日本研究小组发现了第一个有功能的假基因。科学家培育出一种转基因小鼠,它们带有一个名叫“性别致死”的基因。这个名字可怕的外来基因在大多数小鼠身上并没有造成什么负面影响,惟独在某一个品系中名副其实,所有的小鼠在幼年时就死了。研究显示,在这个品系的小鼠中,外来基因偶然地插入了一个叫makorin1—p1的假基因中间,把它破坏掉了。这个假基因是makorin1基因的变异版本,比“正本”要短很多,不编码蛋白质,按传统理论应该没有用处。然而事实是,当它损坏后,对应的真基因也不工作了。 那么,至少这个例子说明,不编码蛋白质的基因也对生存至关重要,没有什么假不假的,只是工作方式与传统基因不同。但最新研究显示,一些RNA可以与其他的RNA、DNA、蛋白质甚至小分子化学物质发生作用,直接影响生理机能——也就是说,不是作为挥动鞭子的角色,而是直接去当苦力。垃圾DNA中某些不编码蛋白质的片断,例如上述试验里的假基因,可能通过转录成RNA来发挥作用。这些片断不是传统意义上的基因,可称为“RNA基因”,它们往往非常短小、难于识别,但又非常重要。它们调控其他基因的表达,使这些基因开启、关闭、更活跃或更不活跃。 垃圾DNA不是真正垃圾还有一些非编码DNA,即使我们完全不了解它的功用,也可以断定它们并不是垃圾,必定有着重要功能,“高度保留共同序列”就属于这一种。2004年,一组美国科学家在《科学》杂志上发表报告说,他们对比研究了人、大鼠、小鼠、鸡、狗、鱼等多个物种的基因组,发现其中存在一些极其相似乃至完全相同的DNA序列。这些序列位于非编码区域中,共有480个,在人、大鼠和小鼠身上完全相同,与狗、鸡、鱼对应序列的相似度也远远超过各物种基因组的平均相似度。不过,在海鞘和果蝇体内却找不到这些序列。人们并不知道这些高度保留序列有什么作用,它们在人和鼠身上的版本完全相同,意味着人和鼠的祖先分家之后的7500万年间,这些序列没有发生任何改变,这是极其不可思议的。 为了防止偶然因素,研究者检查的序列长度都超过了200个碱基对。从统计学上来说,这么长的序列因为独立的偶然变异而重复出现3次基本上是不可能的。有480个这样的序列重复出现3次,就更不可能了。有不少人根本就怀疑这个试验出了问题,认为人类的DNA污染了鼠的DNA样本。此外,这些序列在人与鱼身上的版本差异很小,即在人和鱼祖先分家后的4亿年里改变甚微。这表明它们的稳定性对脊椎动物至关重要,微小的差异都可能造成致命后果。 科学家猜测,有些高度保留序列可能影响着重要基因的活动,还有一些则控制着胚胎发育。这些序列彼此差异很大,从中看不出与其功能有关的线索。科学家正考虑培养出缺少某一高度保留序列的转基因小鼠,观察其生长发育有何异样,由此判断该序列的作用。这一发现再次证明,不编码蛋白质、在传统上被认为是垃圾的DNA,绝对不是真正的垃圾。 人们曾经猜想,越复杂的生物基因数量越多,但事实已经推翻了这种观点。如前所述,人类基因数量与鸡和河豚的基因数量相近,而水稻的基因差不多要比人多一倍,阿米巴和洋葱则证明了基因组的总体大小与生物复杂性也全无关系。到底是什么决定了物种之间的根本差异?看来必须把传统的基因与新近被证明是宝藏的“垃圾”结合起来考虑。 天文学家一度认为,那些在电磁波谱的各频段闪耀光芒的星星和尘埃就是这宇宙里的一切。然而,越来越多的证据使他们认识到,宇宙中还有人类所看不见的暗物质和暗能量,而且事实上它们占去了宇宙质量的绝大部分,我们所熟悉的物质只有百分之几。宇宙的终极命运——是永远膨胀还是坍缩成为一个奇点?它更多地取决于这些暗影中的神秘质量。对暗物质和暗能量的研究是近年来宇宙学的重大进展,也是一项重大挑战,因为科学家至今也没能对它们的本质给出合理解释。垃圾DNA可以说是基因组的暗面,它将改变生物学的面貌,就像暗物质和暗能量改变宇宙学的面貌那样。 垃圾DNA真的是垃圾吗? 在人类基因组计划实施之前,对于这项人类历史上规模空前的世界性合作研究项目究竟该做些什么,存在一些争议。有一派观点认为,只需要测定编码蛋白质的那些DNA序列即可,因为对于DNA序列,我们只关心其中与基因相关的部分,而基因的一般定义就是用来编码一个蛋白质的DNA序列;另外一派观点认为,既然要测,就应该测定人类染色体内所有的DNA序列,不管它是不是跟编码蛋白质有关。这两个观点的差异主要来源于这么一个事实:在一个染色体所包含的完全DNA序列当中,编码蛋白质的部分只占非常非常小的份量,而大部分的DNA序列其实并不参与编码蛋白质,这样一些DNA序列一开始就被称为垃圾DNA,表达了人们对它们的存在价值的基本判断。 不过随着研究工作的深入,越来越多的证据表明,那些所谓垃圾DNA实质上包含了非常重要的信息,并不是“垃圾”!因此今天回顾起来,我们不得不庆幸当时人类基因组项目的负责人最终还是谨慎占据了上风,得以对人类的完全DNA序列进行了测定,从而避免了潜在的重大科学损失。 进化的背景对一个物种而言,它的垃圾DNA确实就象是垃圾,因为至少目前还没有得到确切的证据能够表明它是有用的:它既不能给蛋白质编码、充当基因,也不能给RNA编码,也没有找到明显的与蛋白质等其他分子发生相互作用的迹象。当然,完全有可能它是行使了某种功能的,只不过是在“暗地下”进行,而我们还没有能力看到它行使功能的身影罢了。 既然我们目前对于如何发现垃圾DNA的作用现场还没有任何头绪,那么可以转而间接地去探讨它存在的价值,一个很好的途径是在物种的进化谱系上进行不同物种的DNA序列对比。按照现代生物学的理解,DNA序列记载着一个物种全部的可遗传生命信息,那么处于不同进化地位的物种之间的进化关系,应该是能够通过它们的DNA序列的继承和变化关系来表现的。可以想象,当一个新物种从它的原始物种进化出来以后,它不可能把全部的蛋白质都进行更换,相反,它能够产生的新生种类的蛋白质,应该只是很少量的,但对于它所具有的新的形态和功能而言,却又是关键的。因此只有这样的蛋白质的编码信息才是在它的原始物种的DNA序列里面找不到的。同时其他大部分行使类似功能的蛋白质,都应该是以继承为主的。 现代根据DNA序列所进行的进化论研究确实证实了这点,对于生命而言非常基本的一些蛋白质,从大肠杆菌一直到人身上,都是非常类似的,相应的基因序列当然也差异很小。实际上,生物学家反过来利用了这点,通过对比同一个蛋白质在不同物种之间的基因差异程度,来度量它们在进化谱系上面的距离,甚至根据DNA碱基突变具有无关性和稳定突变速率的假设,把基因变异看成是时光的刻度,从而可以依据这面进化之钟,确定物种之间的相对进化年龄。 保守的垃圾 既然编码蛋白质的DNA序列具有如此深厚的涵义,那么垃圾DNA序列呢?生物学家们从此受到启发,于是把不同物种之间的垃圾DNA也拿来作对比,结果是不比不知道,一比吓一跳! 去年有人初步地比较了一下人和老鼠的基因组序列,发现其中所谓垃圾DNA里面,居然有5%的序列是非常保守的,也就是说它们在人和老鼠之间没有太大差异,而如果拿编码蛋白质的DNA序列进行比较的话,人和老鼠之间没怎么变化的序列的份量比垃圾DNA还少1到2个百分点,当然在那些保守的垃圾DNA里面,包含了部分本来就非常保守的用来编码RNA的序列,不过那个部分所占比例应该不大。 最近又有一组科学家对这个问题进行了更加系统的研究。他们首先通过和老鼠对比,在人的21号染色体上面确定出保守非基因序列(CNGs),严格地从其中排除能够编码已知蛋白质的序列和编码RNA的序列。然后从其中选取220个这样的保守非基因序列,再确定了12种进化关系相距甚远的哺乳动物,包括鸭嘴兽和猴子等。他们运用聚合酶链式反应从这12种哺乳动物的DNA里面寻找那220个保守非基因序列,结果这220个保守非基因序列当中的大多数都至少在一种哺乳动物的DNA序列当中发现,其中超过25%的保守非基因序列在至少10种哺乳动物的DNA序列当中同时发现。 更加令人吃惊的是,这些同时存在于不同哺乳动物DNA序列当中的保守非基因序列的相似性,甚至比同源的编码蛋白质、或者是编码RNA的基因还强。对于其中同时在至少12种物种当中发现的保守非基因序列,如果比较它们的核苷酸排列差异的话,还不及它们的蛋白质编码序列的核苷酸排列差异的一半!最突出的一个例子,是一个包含100个核苷酸的DNA短序列,它在包括人的所有13种哺乳动物之间,只在6个核苷酸的位置上面发生了变异,甚至鸭嘴兽的这个短序列和人的一模一样! 越保守越重要 这说明这个短序列从鸭嘴兽开始,就一直保留在哺乳动物的遗传信息里面,历经如此多的新物种的发生,它都稳定地没怎么发生变化。一般来说,这样高度的保守性对于编码蛋白质的DNA序列是非常有意义的,因为如果一种蛋白质在所有这些物种当中,都承担了一种基本的共通的生命活性功能,那么它的任何微小的变异,都有可能产生致命的后果,那么在进化产生新物种的同时,必定要求这个序列基本不发生变异地被新物种继承。但是既然那些保守非基因序列没有承担编码蛋白质或RNA的任务,为什么也具有如此高度的保守性呢? 正因为这个问题非常费解,于是有人会自然地怀疑这个实验是不是有可能出现错误,例如在其他物种的DNA里面寻找相同的序列时,有没有可能由于样品发生污染,而使得该物种本来没有的序列被混进去呢?这点也是实验者自己最为关注的问题,因此他们采取了一切最严格的措施,以避免这样的错误发生。另外,还存在一个外部证据,表明他们如此惊人的实验结果应该是没有错误的,即除了他们所选择的12种哺乳动物之外,另外一家研究机构公布了他们独立完成的对于狗的类似研究,而把这个狗的数据拿来比较的话,得到的结论是一致的。这样,就可以基本排除对于实验本身出错的担心。 由于他们选取的哺乳动物包括了非常原始的单孔目动物和最先进的人,这意味着这些序列一定经历了大概3亿年之久而没有发生太大的变异,这种保守性提示了它们一定具有对于该物种来说非常重要的作用,否则,发生在这些序列当中的随机变异在这么长久的历史当中一定有所积累才对,但现在既然看不到这种积累,就只能说明它们的变异有可能影响物种的生存机会!一般的估计是,这些曾经被视为垃圾的DNA序列,对于基因的表达具有调节控制作用,当然,这样的猜测还需要未来大量的实验去揭示和验证。 研究人员进一步估计,在人的整个DNA序列里面,大概存在6万个这样的保守非基因序列,相形之下,人所拥有的基因数目,也就是在整个DNA序列里面,编码蛋白质的序列单位,只有大约3万个。因此尽管目前人们把目光主要集中在那3万个基因序列上面,但谁也不敢预测,当那6万个保守非基因序列打破沉默,向我们表述它们的无名功能的时候,我们会感受到多大的震撼!至少现在,已经有越来越多的人相信垃圾DNA绝对不是垃圾了。 Junk DNA真是“垃圾”DNA吗?还是垃圾中的黄金、沙漠中的绿洲?对此,业界专家的争论由来已久。近期,这些争论有愈演愈烈之势,我们来关注一下其最新的动向吧。 真核生物基因组存在着大量的非编码DNA,在人类中甚至超过了97%,这被认为是造物主的非智能设计,也成为随机进化过程的证据。过去一直认为这些序列没有功能,只是一些自私的DNA序列,热衷于自我扩张。因此称为“junk” DNA,即垃圾DNA。这些 “垃圾DNA”主要包括内含子、简单重复序列、移动序列及其遗留物。当然,也有科学家坚持认为“垃圾” DNA就应该称为“非编码”DNA,称为“垃圾”只说明我们对这部分DNA的功能不了解罢了。 在西方,两种进化论试图解释非编码DNA存在的理由。一种理论认为非编码DNA是“垃圾”,由随机产生的序列组成,这些序列已经失去它们的编码能力,只是没有功能的部分复制基因。第二种理论认为非编码基因是“自私的”,它包括那些优先复制的DNA,比编码DNA数量更多。因为它是寄生的,实际上是有害基因。 为什么完美的造物主会创造出这些主要是由无用、非编码区组成的有缺陷的DNA?难道这些“垃圾”就真的是垃圾吗? 大多数科学家猜测,垃圾DNA决不是垃圾。基因组生物学家在这些非编码序列中发现了珍宝,认为“垃圾”是一个严重的误称。早期的研究表明,在“垃圾” DNA背后有一些设计。随后的研究发现,很多的“垃圾” DNA包含了回文结构,以此维持互补链之间的对称。在果蝇和家蚕里,对这些序列的分析表明,这些转座和散开的重复序列是高度非随机模式。这些模式反映出这些序列是在细胞调控之下,而不是无用或自私的垃圾DNA。 在关系很远的物种之间,例如大型偶蹄类哺乳动物和人,在主要组织相容性复合MHC-DRB基因里都有这些简单重复的(gt)n(ga)m DNA序列。如果这些序列真是垃圾,在数百万年的进化过程中就不可能保存下来。另一个研究表明,DNA包含了大范围的不可解释模式。Eugene Stanley博士报道这些模式不是随机改变的结果。一个基因上的一个位置将影响到100万碱基之外的核苷酸,这真是让人难以置信。 英美科学家比较了老鼠和人的α/βT细胞受体位点(TCRAC/TCRDC) Cδ和Cα区相邻DNA 约10万碱基对的DNA序列。研究表明,老鼠和人的T细胞受体基因中同源序列有惊人的相似性。他们比较了那些真正控制接受体构成序列的编码部分,也比较了中间的非编码序列,发觉非编码序列大约有71%的相似性。这些非编码序列是6,000万年以来,人与啮齿动物分开进化过程中四处游移并随意变化的序列部分。2003年11月《科学》杂志报道了Dermitzakis等人的实验结果,他们检测了人21号染色体上一组非基因区域,发现在14种哺乳动物中,这些序列甚至比编码蛋白质区域更加保守。保守的程度表明,这些还没有被确定的区域是有功能的。这些“垃圾”在人体基因组的进化中起了重要作用。 2004年5月7日《自然科学》在线发表了Helen Pearson的文章:尽管还不知道这些DNA片断的功能,但对所有脊椎动物来说,这些垃圾DNA其实可能比任何猜想的还要重要。加州大学的David Haussler团队对比了人、小白鼠和老鼠的基因组序列。发现在3个物种中,480多个保守区域是完全相同的,这很让人吃惊。这些物种大部分序列与鸡、狗和鱼的序列也很相似,但是海鞘和果蝇中没有这些片断。这个事实说明,在人类和鱼由一个共同祖先进化来的4亿年中,变化很小,说明这些垃圾DNA对这些生物体的后代是很重要的。研究者也正调查这些序列实际所起的作用。在不同的动物中存在完全相同的成分,告诉我们,这些片断的序列即使是微小变化,在进化过程中可能被淘汰。与此成对比的是,非必须的DNA区域趋向于累积突变,因此在不同的物种中序列不同。 Haussler认为,它们可能控制了必需基因的活性。大约有1/4序列与基因重叠在一起,并且可能被转换为编码蛋白质的中间分子RNA,这些序列可能将RNA剪接拼接为不同的形式。另一个可能是这些序列控制了胚胎的发育,从鱼到人的发育极其相似。在以前的研究中,科学家已经知道有类似的保守序列成分与大脑和四肢发育有直接关系。直到现在,有人认为是人DNA污染了老鼠样品,才出现了人和老鼠的极端保守片断100%相同这个结论。 近年来的研究表明,这些不装配基因的DNA序列在生命活动中有着重要的作用。大部分的非编码DNA在所属基因的有效活动过程中发挥着本质作用。科学家们断定:曾被认作是无用的、不属于保持基因完好无损代代相传的的DNA,实际上是被高度完好地保存了下来并被利用着。同基因一样,它们在经历了几万年有时是几百万年的进化之后,其化学上的属性还完好如初,这就意味着,曾经被认作是无用的“垃圾”对于拥有它们的器官来说是必不可少的。对于蛋白质的大部分精密控制都发生在非编码的垃圾区域内。 一定的“垃圾”区域可以充当DNA变化的存储库,这样DNA发生变化并可以重新组合成新的模式,以此推动进化向前发展。而且,其他的一些非编码区域充当了急剧变化的缓冲器,它们吸收那些私自渗透进动物染色体的遗传物质和病毒的影响。如果没有这些非编码区域去吸收外来的干扰因素,病毒或外来的遗传物序列可能会插入到重要的基因中间,从而破坏重要基因的正常功能。科学家们猜测,这些垃圾DNA参与了染色体的组织结构,或某些常规的功能。2002年9月《自然》杂志报道,这些垃圾DNA可以促进细胞分裂。 美国哈佛医学院Fred Winston研究团队在最近的研究中提出了新的证据,认为垃圾DNA有重要作用。他们在酵母基因组的垃圾DNA中发现了一种新基因。这个新基因并不编码蛋白质或者酶,但当这个基因开启时,它能调控临近基因的表达。领导该项研究的Fred Winston教授表示,“这并不能解释所有垃圾DNA。它表明了部分垃圾DNA的潜在用途。” “我无法想象有这样的调控基因存在。”新发现的基因名为SRG1,它能够利用转录获得的RNA屏蔽或者压制酵母基因组中邻近基因的功能。他们认为其它生物体的基因组中也应该存在这种基因,包括人类,也以同样的方式起作用。 这之前,英国科学家研究发现,“垃圾DNA” 能影响疾病严重程度。有些“垃圾DNA” 包含着重复许多次的DNA序列。这种重复的DNA能够激发某种反应,最终阻止特定的基因被打开,干预细胞的“基因沉默”机制,进而影响疾病发生。人体细胞分裂增殖的过程中,所有遗传信息都被复制并传给下一代细胞。不同的细胞拥有不同的功能,例如肌肉细胞与血液细胞功能就非常不一样,细胞需要打开和“沉默”特定基因来实现特定的功能。“基因沉默”机制对于细胞能否发挥正常功能非常重要,如果“沉默”不当,就会导致疾病。 另外,垃圾DNA还是DNA损伤的修复者。由密歇根大学医学院和路易斯安娜州立大学的科学家共同进行的这项研究,首次证明在哺乳动物细胞中,称为LINE-1元件的一段垃圾DNA 能够跳到DNA链发生断裂的染色体上,溜进断裂处修复DNA损伤。正常情况下,L1是用一种叫做核酸内切酶的酶来剪切DNA,这样它们就可以将自己插入到基因组中。试验证明,存在另一种无需核酸内切酶的机制,即直接跳到断裂DNA上,这为L1提供了另一条整合到DNA链上的途径。由于L1是如此古老,它们跳到新位点时有时携带有基因片段,因而遗传学家Moran认为,L1在人类进化中扮演着重要角色——增加遗传多样性。 对于真核生物来说,非编码DNA对于分化细胞的差别基因表达是必须的。近来的研究证明,非编码DNA为中期染色体带型提供了结构基础。CpG岛、DNA环、G R带型为主的基质附着位点,揭示了非编码DNA是如何形成染色体结构的基础。另一个研究表明,真核生物的非编码DNA作为核里的一种结构元件是有功能的。研究检测了单细胞光合成生物Crytomonads的基因组。依据核在细胞中的比例,这种生物体的细胞大小有很大差异。研究者发现,大量的非编码DNA与核的大小成比例,因此认为,大核生物在结构上需要更多的非编码DNA。 越来越多的证据表明,非编码DNA对发育过程中基因表达的调控起了重要作用。凝胶阻留法试验显示了这些简单重复序列与核蛋白相结合,并显示出了特有的DNA-蛋白质相互作用的特性。DNA-蛋白质相互作用功能还没有决定。然而,许多DNA-蛋白质相互作用的其他例子,显示了DNA转录的调控作用。这些研究证明非编码DNA调节了光感受器细胞、生殖系统和中枢神经系统的发育。因此,非编码DNA起了调节发育和胚胎起源的重要作用。这些非编码DNA对蛋白质的翻译提供了适当的结构。 很多研究已经证实,非编码DNA对于相邻基因的转录有增强作用。在嗜酸粒细胞衍生神经毒素、嗜酸细胞阳离子蛋白、IgM重排基因的可变区域、α-球蛋白基因、微管蛋白基因、4-N-乙酰半乳糖氨基转移酶、醛缩酶B基因、乙醛还原酶基因k轻链基因等等,都有基因内增强作用的描述。另一些研究证实非编码DNA作为沉默基因,对临近基因的转录起抑制作用。在成骨素基因、2-晶体蛋白基因、CD4 基因、β-珠蛋白基因、神经胶质细胞粘连分子、神经元-神经胶质细胞粘连分子、血小板衍生的生长因子A链基因、肾素基因等等的研究中对此有描述。 非编码DNA作用是如此众多和普遍,进化研究者关注着这些序列的“协同进化”模式。事实上,与进化论者陈述的刚好相反,这些非编码DNA对于基因组的功能来说是必须的。“垃圾”DNA是一些让人吃惊的“垃圾”,反驳了非编码DNA 的“自私”和“垃圾”理论。科学家正努力找出垃圾DNA大量存在的原因,并通过它们找到潜在的治疗疾病的方法。 然而,最新的报道认为,“垃圾” 还是垃圾。Elizabeth Pennisi在2004年6月11日《科学》上发 表文章,报道了这类DNA序列用完后就可以丢弃。加州伯克利国家实验室的遗传学家Marcelo N—brega发现,从老鼠的基因组里剔除了上百万的这些碱基,老鼠表现也很正常。大约2年前,Edward Rubin和同事发现,人基因遗弃的一些DNA序列-基因之间的非编码DNA长序列,几乎和老鼠中遗弃的序列一样。 在8,000多万年前有一个共同祖先,这种物种间的保守性看起来是不太可能的,除非这些区域都是服务于同一个目的。因此作者假设这些区域一定执行某种功能,即进行基因调节。N—brega和同事对比了鱼和人之间的这些保守区域,我们知道鱼和人关系较疏远。大多数的保守序列不仅有功能,而且是帮助调节基因。但是鼠-人对比的结果却不一样。他们比较了2个物种中的15个遗弃序列,发现只有一个序列是调节区。 这很让人迷惑,N—brega和同事决定从老鼠基因组里删除这些被遗弃的垃圾DNA片断,希望能了解到这些片断有什么其他功能。遗传学家Yiwen Zhu敲除了2个区域,一个大约是200万碱基,另一个是100个碱基,这2个区域在人和老鼠中都是保守的,而在鱼中不保守。在将修改过的基因组插入到老鼠胚胎干细胞之后,Zhu在老鼠胚胎中插入了细胞。随后,他们在试验老鼠的后代中寻找异常。但是基因工程老鼠和正常老鼠之间看不到什么差别,也没有明显的病症。 敲除了200万碱基而没有什么影响,这很让人惊奇。因此,有人怀疑这不真实。他们认为这些非编码区事实上可能有功能,只是在N—brega的试验中没有表现出来而已。 如Rubin所说,基因组就像肥皂剧一样吗?可以跳过100集而没有什么影响?还是像海明威的小说,少看一页故事线索就找不着了?或是如澳大利亚天体生物学家Davis所称,人类垃圾DNA可能掩藏了外星人的某些贵留 信息?这个问题将继续吸引着大批科学家对此开展研究,相信在不久的将来,我们可以得到准确结论。■ “垃圾”DNA里有文章在近期,弯曲的,黏着的,大名鼎鼎的DNA分子被加上了诸多高贵的比喻:它是生命之书,分子主管,是人类的生命蓝图。 然而,在那些关注整个分子,而并非局限于排列在化学线圈上的单个基因的研究者看来,另外几个简单的比喻更好一些:DNA正像祖母的小阁楼,或是城镇中小巧精悍的跳蚤市场。 另外一些人认为,人类的DNA可以被看作是一种微小的生态系统,一个不可见的居住地,其中充斥着互相竞争的遗传物质碎片,时常表现得温顺,实际上它们是自私自利的寄生物,完全不顾它们所寄生的人类寄主细胞的各种需要。 这些类比来源于最近对于大量的双螺旋线区域的研究,这些双螺旋线并非是作为制造体内蛋白质的节目单而存在的,它们的区域经常会被加上一种轻蔑的描述:“垃圾DNA。” 在构成人体DNA的30亿个化学单元或碱基对之中,仅有3%~5%是作为编码的有效区域而存在的:一些产生荷尔蒙、骨胶原、血红蛋白、内腓肽和酶,以及所有其他的人体蛋白质的有效物质的基因指令。剩余的DNA碱基对有待于解释,一句句的、一页页的、一卷卷的有关基因序列的说明乍看起来似乎是什么也没有说。没有用的填充物、塑料泡沫,以及所有的废物都几乎挤到了身体的每一个细胞核中。 正如科学家们所愿意指出的那样,一个人的垃圾是另外一个人的财富。他们渐渐发现大部分的非编码DNA在根植于其中的基因的有效活动过程中发挥着本质性的作用。科学家们断定:曾被认作是无用的,不属于保持基因完好无损地代代相传的正面力量的DNA,实际上是被高度完好地保存了下来并被利用着。正像基因一样,它们在经历了几万年有时是几百万年的进化之后,其化学上的属性还完好如初,这就意味着,曾经被认作是无用的“垃圾”对于拥有它们的器官来说是必不可少的。 在某些情况下,“垃圾”被看作是基因的微妙的促进者,它把基因的活动从低声细语调节放大到大声呐喊。在另一些情况下,当染色体被弯曲、被变作褶皱状时,“垃圾”告知染色体它们的形状应该是怎样。 一定的“垃圾”区域可以充当DNA变化的存储库,允许DNA变得更加容易混合、突变并重新组合成新的模式,以此推动进化向前发展。它们如同阁楼里的古董,今天看来是奇异的,有人撞见了,把它擦亮后,拖到楼下的居室之中,给所有人观赏赞叹。 而且,其他的一些非编码区域是充当了急剧变化的缓冲器,它们如同掩护性的外衣—样,吸收那些私自渗透进动物染色体的遗传物质和病毒的影响。如果没有这些额外的非编码区域去吸收外来的打击因素,病毒或外来的遗传物序列(从染色体的一个部分跳到另一个部分,被称为“运输体”或“跳跃基因”的那些神秘的遗传物质)可能会在重要基因的中间有少量的着陆,从而破坏重要基因的正常功能。 这项新的研究确证了“人类基因组工程”的倡导者们的主张的可行性,“人类基因组工程”是探索人类DNA全部构成的一个全联邦的规划。实用主义者们建议应该集中研究那些包含5万~10万基因的正常基因区域,而那些沉迷于“垃圾”基因的人们则坚持说所有的30亿基因块都应该得到重视。他们设想说,很多人类进化的有趣的真知灼见将会从研究基因间及基因周围的大量物质的工作中得来。 哈佛大学的一位人类基因学理论家沃尔特·吉尔伯特博士说:“我不相信DNA是垃圾的说法,我一直认为所有的信息都包含在编码区之内的观点是浅见的,这反应了蛋白质化学家对待DNA的偏见。”他补充说,编码区可能产生化学家们所重视的蛋白质,但是,真正的生物学家们知道,对于这些蛋白质的大部分的精密控制都是在幕后发生的,存在于非编码的垃圾区域内。 在发表于《国家自然科学院学报》的文章中,罗伊·布里顿(加利福尼亚技术学院博士,26年前,他首次描述了“垃圾”DNA)说:有一些我们最熟知的灵长动物的DNA垃圾有作为分子向导的存在的理由。这些序列,被称作“阿鲁序列”(Alu sequences),它们是短小的,重复性的,每个大约有280个DNA碱基对,它们广泛地分布在包括人类在内的所有灵长类动物的染色体之中。它们长期以来被看作是原始时代遗传事件的无用的剩余物,像病毒一样的DNA碎片嵌入到了南非古猿的染色体当中,并且由于它们向来无害而从未被清除出去。按这种说法,“阿鲁序列”一直是很懒散地存在着,经过数万年左右的缓慢的、温和的、复杂的复制过程,便成了我们今天所见到的DNA。 然而,布里顿博士认为,无论它的起源是什么,“阿鲁序列”一直以来被灵长动物的寄主选派来履行职责,可能是充当着它附近基因的微妙的调节器。他说“阿鲁序列”是如此完好地保存下来,以致于我们不能把它解释成为毫无用处的流浪汉。而且,“阿鲁序列”的某些被保存的部分,正如有人预测的那样,可能是为那些敲动基因或提升基因的蛋白质提供了庇护场所。 布里顿博士在一次电话访谈录中说:如果说那些典型的“垃圾”是处在选择的压力之下并可能具有某些功能,下这种结论似乎为时过早。但是我接受一般人的观点,如果某种东西普遍地存在,它会被利用起来的。 在《自然基因》杂志中,英国哥伦比亚维多利亚大学的本·F·库卜博士和美国西雅图华盛顿大学的莱罗依·胡德博士说,他们比较过人类的大块的DNA和相应的老鼠的DNA。他们研究了负责生产身体T细胞接受体(免疫系统的关键部分)的基因的10万个基因碱基对。他们比较了那些真正控制接受体构成的序列的编码部分,也比较了其中间的部分,即所谓的基因内区(内含子),这些基因内区是在产生一种蛋白质(如许许多多的化学ubs和wells)的复杂过程中被编制出来的。 令他们十分吃惊的是,他们证实了一种对于动物的免疫系统十分重要的基因的推测:不仅人与老鼠对于接受体所发出的命令极其相似,而且二者中被认为是废物的基因内区也很相似。这些基因内区却正是在6000万年来的人与啮齿动物区分开来的进化过程中四处游移并随意变化的序列部分。既然如此,那我们为什么还要不厌其烦地研究对于接受体最后功能可能毫无用处的那些粗笨的遗传骚扰呢? 库卜博士说:“发现这种遗传物质时,我们不得不思考,基因内区参与了染色体的组织结构,或某些常规的功能。‘垃圾’一词对我来说,就是‘我不知道’的委婉说法。” 可是库卜又说,人与啮齿动物在其他一些基因内区和非编码区域方面都存在着很大差别,这似乎表明在某些情况下,这种遗传是不必要的。但事实正相反:这些区域可能是发生变异和进化的场所,是一个安全的试验基地,在这里,可能会产生新的遗传信息而并不破坏现有的基因。最后,这些变化可能会通过灵敏的染色体的混合作用而整合到动物的基因编码区之内,而且可能会有一种新的蛋白质产生。 马里兰州罗克维尔市基因组研究所的J·克瑞格·万特博士说:“我的观点是,‘垃圾’DNA在进化与重组的过程中是绝对必要的。” 万特博士指出,那些把“垃圾”DNA长期地忽略掉的人们有充分的理由。毕竟,一些生物没有这些“垃圾”,也是功能完好的。天花病毒,大肠杆菌和其他微生物的基因都是一个挤着一个,中间并没有“垃圾”或基因内区。甚至有几种高等生物,如河豚,就只有很少的非编码DNA。英国剑桥的医疗研究委员会的西尼·布热纳博士建议说,研究河豚的基因组是理解所有高等动物染色体的一个捷径。 然而,正如布里顿和其他人所解释的,绝大部分的复杂生物有复杂的基因组,也有很多的非基因序列。两种类型的序列:基因与非基因,通常很容易被区分开。基因在它们的序列里往往是丰富多样的;也就是说,单个的G、T、A、C碱基对是在相当复杂的组合中被编写出来的。与此相反,垃圾的序列经常是更简单,更多余的,是由一两个重复无数次的字母组成的。但是,这仅仅是一个一般的规律,科学家们经常被一种观念误导,他们仅仅是因为一种基因显得单一,就认定它是垃圾。同样地,一些非编码区也经常呈现出相当的复杂性。 科学家们也已经发现,存在着一种高级基因组的各种类型所遵循的模式。大部分哺乳动物,无论是人、田鼠、猫,还是鼹鼠等,其基因组有大约30亿个碱基对的长度,这就说明,“垃圾”和基因在哺乳动物的漫长的进化过程中,是处在某种奇怪的均衡状态中的。而且,由于完全不清楚的原因,植物的基因组经常是比哺乳动物的要更长。例如,小麦的DNA大约有160亿个碱基对的长度,而野百合花却大约有1000亿个的长度;大部分“垃圾”DNA是冗长的、非编码的单一形态。 吉尔伯特博士指出,一些微生物,如天花病毒和细菌,有一些微小的,整齐的并不必要的基因组。它们迅速地繁殖,却不能引发与立即复制相关的任何活动。但是,高等动物的生命策略和复制策略都不仅仅是每20秒发生一次双裂变那样简单,它们能提供更复杂、更高级的基因组并且能为漫长而曲折的进化过程做出贡献。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。