词条 | 人类单倍体型图计划 |
释义 | 国际人类基因组单 体型图计划的目标是构建人类DNA序列中多态位点的常见模式,即单体型图(haplotype mapping),简称HapMap。 含义含义什么是hapmap HapMap是人类基因组中常见遗传多态位点的目录,它描述了这些变异的形式、在DNA上存在的位置、在同一群体内部和不同人群间的分布状况。HapMap计划并不是利用HapMap中的信息来建立特定的遗传变异与某一疾病之间的联系,而是为其他研究者提供相关信息使之能够将遗传多态位点和特定疾病风险联系起来,从而为预防、诊断和治疗疾病提供新的方法。 构成我们细胞中的DNA是由四种基本化学“构件”——腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)和鸟嘌呤(G)所组成的长链。人类细胞中的23对染色体就是由多于60亿个这种化学单位排列而成。(见“http://www.dnaftb.org/dnaftb/上的遗传学基本知识”)。这些遗传序列包含的信息可以影响我们的身体性状、罹患疾病的可能性以及身体对遇到的外界物质的反应。 不同人的遗传序列极为相似。若比较两个人的染色体,他们的DNA序列上可以连续数百个核甘酸都是相同的。然而,平均约每1200个碱基就会有一个核甘酸的不同)。在一个位点上某人是A,另一个人却有可能是G;或者某人在特定的位点上多出或者缺失一些碱基或DNA片段。染色体上每一个不同的“拼写”被称作一个等位位点(allele),一个人染色体上的所有等位位点的集合就是基因型。 区别不同个体的碱基的差别是目前最常见的遗传多态现象,这些遗传上的差别称为单核苷酸多态性或SNPs(发音为“snips”)。国际人类基因组单体型图计划通过识别在人类基因组中常见的大约一千万个SNPs的大多数,来确定人类的大部分遗传多样性的分子基础。 对遗传学家来说,SNPs也是进行基因定位的分子标记。比如说基因上一个拼写的改变会增加罹患高血压的风险,但是研究者们并不知道这个基因在染色体上的位置。他们可以比较高血压患者和正常人的SNPs。如果某一个SNP在高血压患者中很常见,就可以把这个SNP作为标记来定位和识别与这一疾病相关的基因。 然而,检测人类染色体上所有的一千万个常见SNPs的费用极其昂贵。HapMap的构建将使得遗传学家可以利用SNPs及其它遗传上的变异在染色体上的组成特点。一些相互邻近的多态位点趋向于在一起共同遗传。例如,对于所有那些在某一位点是A而不是G的人来说,该位点周围染色体区域上的SNPs状况很可能是一致的。这些变异连锁的区域就是单体型(图)。 在人类染色体的很多区域中,只发现了少数的几种单体型 [见“单体型的起源”]。在一个特定人群中,55%的人可能拥有同一种单体型,30%的人可能拥有另一种单体型,8%的人可能拥有第三种单体型,而其余的人可能拥有若干种稀有的单体型。HapMap计划将鉴定来自世界不同地区的四个群体的常见单体型,以及特异识别这些单体型的标签SNPs。通过检测个体的标签SNPs(该过程称为基因分型),研究者就可以鉴定一个人的单体型的集合。估计包含了大多数遗传变异的模式信息的标签SNPs的数量大约是30万至60万,远远少于一千万个常见SNPs。 意义一旦从HapMap中获得标签SNPs的信息,研究者将能利用它们来定位与重要医学特征相关的基因。假设研究者想要找到与高血压相关的遗传变异,他并不需要确定一个人的所有SNPs的类型,而只须对少得多的标签SNPs进行基因分型就可以得到一个人的单体型的集合。研究者可以集中研究可能与疾病相关的特定候选基因,也可以纵观整个基因组来找到与疾病相关联的染色体区域。如果高血压患者都倾向于具有一个特别的单体型,与该疾病相关的变异位点很可能就在这个单体型内部或邻近区域。 遗传多态性和单体型图的用途国际HapMap计划通过提供充分资源,使研究人员用于发现与疾病及个体治疗反应相关的遗传多态位点,从而对人类健康做出贡献。一旦发现这样的变异位点,研究人员可以更多地了解该疾病的起因以及预防、诊断和治疗的方法。 项目的目标并不是直接确定与疾病相关的基因,而是通过确定单体型,使单体型图成为用于进行关联研究的一个工具。在关联研究中,研究人员将患者的单体型与健康人(对照)的单体型相比较。如果与对照相比,某一种单体型在患者中经常出现,影响该疾病的基因可能就存在于这个单体型内部或附近。 常见的疾病如癌症、中风、心脏病、糖尿病、忧郁症和哮喘等是多个遗传变异位点与环境因子共同作用的结果。根据“常见疾病-常见变异”的假说,罹患常见疾病的风险受到人群中相对常见的遗传变异的影响。目前还没有足够的证据来支持该假说的普遍性,但是越来越广泛分布的与常见疾病相关的遗传变异位点正在被发现,包括那些涉及自体免疫疾病、精神分裂症、糖尿病、哮喘、中风和心脏病的多态位点。国际HapMap计划的益处之一就是可以利用单体型图HapMap来更多地了解常见疾病和我们的基因之间的关系。 HapMap还将产生目前尚很难预料的知识上的进展。未来可以在患者的遗传构成的基础上实现个体化医疗,从而得到最好的效果并将副作用降至最低。与长寿和抗病能力有关的遗传变异将被确定,从而产生具有广泛益处的新疗法。对任何新知识而言,HapMap既带来新的挑战,又带来不可预料的空前的机遇。 人群和样品大多数常见的单体型存在于所有的人类群体中,但它们在不同人群中频率不同。因此,为了选择标签SNPs,有必要获得几个人群的数据。先期的研究发现,单体型频率在尼日利亚(Yoruba)、日本、中国和美国(1980年由Centre d'Etude du Polymorphisme Humain [CEPH] 采集并曾用于其它人类遗传图谱研究的北欧和西欧后裔的样品)人群样本中有着显著的差异。这些差异性保证了通过对这些人群进行大规模的单体型分析的合理性,因而自上述人群的绘制的单体型图应当对世界上所有的人群有益。然而,增加其他人群会获得多少更多信息将通过一项检查其他样品的若干染色体区域的单体型的平行研究做出确切回答。 用于构建单体型图计划的DNA样品共有270份,分别来自90个尼日利亚Ibadan的Yoruba人(30个父母加一个后代组成的三体家系),45个东京的日本人(无关个体),45个北京的汉族(无关个体),和90份CEPH样品(30个三体家系)。样品的数目能使通过单体型图计划发现几乎全部频率大于5%的单体型。在经过恰当的社群参与(community engagement)或公众咨询以及个人的知情同意后,本项目所有新样品的采集程序都获得了相应的伦理委员会的批准。设计社群参与的目的则是为了对具有不同文化背景的取样社群产生的对知情同意和样本采集程序的特殊疑问有所理解和反馈。 CEPH样品是从非盈利的Coriell医学研究所获得(http://locus.umdnj.edu/nigms/)。2004年,经相应的伦理委员会批准后,Coriell将为进一步的研究提供其他血样的DNA或细胞系。样品中只有人群和性别的标识而没有医学或个体的可辨别信息。每一个采集新样品的社群将成立一个咨询委员会,以保持同Coriell的联络并确保这些样品将来的使用与知情同意书上的条款是一致的。 伦理学问题这一项目包含若干伦理学问题。因为所研究的样本并不包含捐献者的个人标识,所以泄漏个人信息的风险很小。不过,为了以后研究者能够针对所研究人群选择最佳的标签SNPs,每一个样本将按人群标记。标签SNPs的选择将以单体型频率为基础。如果基因组中某些特定区域的单体型在不同的人群中有显著不同的频率,那么这些区域的标签SNPs也可能因人群而异。所以,每个人群的SNP和单体型频率将被计算和用于比较研究。 在这种情况下,如果在一个人群中发现了一个高频的疾病相关的变异位点,而且与此位点相关的疾病风险在该人群中高于所有或大多数其他人群,就有可能产生对这个群体的诬蔑和歧视。本研究另一个潜在的顾虑是人群的含义来自祖先的居住地域,这可能导致“种族”的划分,而这种更多具有社会含义的划分常被错误地以为是有准确的生物学含义的。项目将通过社群参与来了解目标人群对这些问题的看法或疑问。 科学策略为了构建单体型图,要对样本的至少100万SNPs进行全基因组规模的基因分型检测。在本研究计划起步时,dbSNP公共数据库中共有280万个SNPs。然而,很多染色体区域的SNPs太少,另有很多SNPs则因为频率太低而无法使用。所以,构建单体型图还需要数百万更多的SNP位点。截止到2003年9月,本项目又发现的280万SNPs。现在这项工作仍在继续进行。 整个SNP分型工作将由加拿大、中国、日本、英国和美国的10个研究中心进行。每个中心将针对所承担的染色体对所有的研究样本进行基因分型检定。这些中心共采用了5种检定分型技术。项目的初期目标(至2004年6月左右)是构建出一个约由60万个在人类基因组中均匀分布的SNPs构成的图谱,其SNP密度约为每5000个碱基一个位点。然后将针对需要定义单体型边界的区域进行更多的SNP位点的检定。分型结果的质量将通过重复样本、所有中心对一组同样SNPs进行检测、以及对一定数量的已检定结果进行不同中心的互相检测来保证。 数据分析此项研究的基本数据是各人群共计270个样品的SNP等位位点的频率和基因型。为了构建单体型和选择标签SNP位点,本研究将采用标准的SNP连锁分析如D'和r2 ,同时发展新的分析方法。因为本研究的所有数据将免费共享,其他研究者也可以用另外的手段来分析数据或是改进分析方法。 本研究产生的数据将显示常见的人类基因组遗传的多态模式,包括个体间遗传多态位点的数量,人群间具有不同单体型频率的区域和不同染色体区域SNPs的连锁范围。 获得数据和知识产权政策 HapMap项目将向公众公布所有的实验数据,以让任何研究者利用这些信息。新的SNP位点、SNP基因分型实验设计、SNP检定结果和频率,以及构建的单体型一经产生,将很快发布。当对染色体区域进行了足够的SNP分型来确定紧密连锁的区域时,这些区域的单体型、个体的基因型和标签SNPs将无条件地公开发布。然而,对那些还没有足够分型密度数据的区域,要获得个体的基因分型结果,就要遵守数据访问政策。这项政策只有很小的约束,既使用者必须同意不能使其他人访问这些数据有所减少,同时只能与也同意这个政策的人士共享这些数据。这个暂时性的政策的唯一目的就是为了保证项目的所有数据能被公众所享有。项目完成时,任何还未发布的数据都将公开。 本研究项目不包含将遗传多态性落实到表现型的有特殊利用价值的研究,如疾病易感或对药物的反应。项目的参加者认为将还未有产生特殊用途的SNP位点、基因型或单体型用于专利发明是不适当的。只要使用者不影响其他人获得本研究的数据,数据访问政策不阻止使用者对他们已经显示有特殊利用价值的SNP位点或单体型图申请专利。在数据公布以前,项目参加者不会将本项目的数据用于自己实验室的其它研究。 内部数据访问政策在数据发布至dbSNP数据库(如SNP位点、SNP检测设计、等位位点及其频率)或数据协调中心的基因型数据库(如个体的基因型和单体型)之前,国际“人类基因组单体型图计划”的参加者不能将本项目的数据用于自己实验室的其它研究项目(包括他们自己产生的数据)。 国际“人类基因组单体型图计划”的参加者使用与其他使用者一样的数据访问政策。对于基因型和单体型数据来讲,也使用公众数据访问政策的协议。所有参加者已经确认他们接受与其他使用者一样的许可协议。 如果没有确认的用途/功能(即与表现型相关),项目参加者不能对本研究产生的SNP位点或单体型申请专利。参加者如果有功能证据或其他已确认的用途,可以对与疾病或功能相关的SNP位点或单体型申请专利。但是,因为HapMap计划不含有产生功能或应用信息的研究,所以这些结果只能通过HapMap项目以外的研究获得。如果项目参加者想使用本计划的数据进行其它研究,只能通过已对外公布的dbSNP库或数据协调中心的数据库获得信息。如果参加者申请了专利并获得批准,他们不能就此妨碍其他人访问HapMap的数据。 参加机构HapMap计划将由日本、英国、加拿大、中国、尼日利亚和美国的科学家们合作完成。项目正式开始于2002年10月27-29日的HapMap计划第一次会议(http://genome.gov/10005336),预计进行3年。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。