A. 什么技术有助于测出人类基因组碱基对的全序列
第1代标记
经典的遗传标记,例如ABO血型位点标记,HLA位点标记。70年中后期,限制性片段长度多态性(RFLP),位点数目大于105,用限制性内切酶特异性切割DNA链,由于DNA的一个“点”上的变异所造成的能切与不能切两种状况,可产生不同长度的片段(等位片段),可用凝胶电泳显示多态性,从片段多态性的信息与疾病表型间的关系进行连锁分析,找到致病基因。如Huntington症。但每次酶切2-3个片段,信息量有限。
第2代标记
1985年,小卫星中心(minisatellite core)、可变串联重复VNTR(variable number of tandem repeats)可提供不同长度的片段,其重复单位长度为6至12个核苷酸 ,1989年微卫星标记(microsatellite marker)系统被发现和建立,重复单位长度为2~6个核苷酸,又称简短串联重复(STR)。
第3代标记
1996年MIT的Lander ES又提出了SNP(single nucleotide polymorphysm)的遗传标记系统。对每一核苷酸突变率为10-9,双等位型标记,在人类基因组中可达到300万个,平均约每1250个碱基对就会有一个。3~4个相邻的标记构成的单倍型(haplotype)就可有8~16种。
物理图谱
物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。DNA物理图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。因限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。因此,DNA物理图谱是DNA分子结构的特征之一。DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图。广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法──标记片段的部分酶解法,来说明图谱制作原理。
用部分酶解法测定DNA物理图谱包括二个基本步骤:
⑴完全降解
选择合适的限制性内切酶将待测DNA链(已经标记放射性同位素)完全降解,降解产物经凝胶电泳分离后进行自显影,获得的图谱即为组成该DNA链的酶切片段的数目和大小。
⑵部分降解
以末端标记使待测DNA的一条链带上示踪同位素,然后用上述相同酶部分降解该DNA链,即通过控制反应条件使DNA链上该酶的切口随机断裂,而避免所有切口断裂的完全降解发生。部分酶解产物同样进行电泳分离及自显影。比较上述二步的自显影图谱,根据片段大小及彼此间的差异即可排出酶切片段在DNA链上的位置。下面是测定某组蛋白基因DNA物理图谱的详细说明。
完整的物理图谱应包括人类基因组的不同载体DNA克隆片段重叠群图,大片段限制性内切酶切点图,DNA片段或一特异DNA序列(STS)的路标图,以及基因组中广泛存在的特征型序列(如CpG序列、Alu序列,isochore)等的标记图,人类基因组的细胞遗传学图(即染色体的区、带、亚带,或以染色体长度的百分率定标记),最终在分子水平上与序列图的统一。
基本原理是把庞大的无从下手的DNA先“敲碎”,再拼接。以Mb、kb、bp作为图距,以DNA探针的STS(sequence tags site)序列为路标。1998 年完成了具有52,000个序列标签位点(STS),并覆盖人类基因组大部分区域的连续克隆系的物理图谱。构建物理图的一个主要内容是把含有STS对应序列的DNA的克隆片段连接成相互重叠的“片段重叠群(contig)”。用“酵母人工染色体(YAC)作为载体的载有人DNA片段的文库已包含了构建总体覆盖率为100%、具有高度代表性的片段重叠群”,近几年来又发展了可靠性更高的BAC、PAC库或cosmid库等。
序列图谱
随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。
大规模测序基本策略
逐个克隆法
对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)。
全基因组鸟枪法
在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)。
B. 图位克隆法的图位克隆的技术环节
用于作图群体的类型可有多种。一般说来,在这类群体中,异花授粉植物分子标记的检出率较自花授粉植物的高。但是对于基因的图位克隆而言,培育特殊的遗传群体是筛选与目标基因紧密连锁的分子标记的关键环节。这些遗传材料应该满足这样的条件,即除了目标基因所在座位的局部区域外,基因组DNA序列的其余部分都是相同的,在这样的材料间找到的多态性标记才可能与目标基因紧密连锁。
目标基因的近等基因系(NILs)是符合条件的一类群体。近等基因系是指几乎仅在目标性状上存在差异的两种基因型个体,这可通过连续回交的途径获得。由于NILs的遗传组成特点,一般凡是能在近等基因系间揭示多态性的分子标记就极有可能位于目标基因的两翼附近。Martin等(1993)就是用RAPD技术分析番茄PTO基因的近等基因系而获得了与该基因表现共分离的分子标记,以该分子标记为探针筛选基因组文库而实现了染色体登陆。又如在玉米上,利用AFLP技术分析玉米CMS-S型雄性不育的恢复基因及近等基因系,已获得与目标基因紧密连锁的分子标记并以其用作分离RF3基因的探针。
一般说来,当标记为显性遗传时,欲获得最大遗传信息量的F2群体,须借助于进一步的子代测验,以分辨F2中的杂合体。为此,Michelmore等(1991)发明了分离群体分组分析法(bulked segregant analysis,BSA)以筛选目标基因所在局部区域的分子标记。其原理是将目标基因的F2(或BC1)代分离体的各个体仅以目标基因所控制的性状按双亲的表型分为两群,每一群中的各个体DNA等量混合,形成两个DNA混合池(如抗病和感病、不育和可育)。由于分组时仅对目标性状进行选择,因此两个DNA混合池之间理论上主要在目标基因所在局部区域的差异,这非常类似于NILs,故也称作近等基因池法。研究表明,近等基因系法、分离群体分组分析法再结合AFLP等强有力的分子标记技术使人们能够在短时间内从数量众多的分子标记中筛选出与目标基因紧密连锁的标记。更为有意义的是,这种策略在尚未构建遗传图谱的物种中也是可行的。 比较基因组研究主要是利用相同的DNA分子标记(主要是cDNA标记和基因克隆)在相关植物种之间进行遗传或物理作图,比较这些标记在不同物种基因组中的分布特点,揭示染色体或染色体片段上的基因及其排列顺序的相同(共线性)或相似性(同线性),并由此对相关物种的基因组结构和起源进化进行分析。已有的研究表明,存在生殖隔离的不同植物物种之间在标记探针的同源性、拷贝数及连锁顺序上都具有很大程度的保守性。如番茄、马铃薯和辣椒;水稻、小麦和玉米;小麦、黑麦和大麦;高粱和玉米;拟南芥和芸薹属;以及大麦和水稻。更为有趣的是,Moore等(1995)同时对水稻、小麦、玉米、谷子、甘蔗及高粱等6种主要禾本科物种的基因组进行了比较作图研究,结果表明其中基因组最小的水稻居于中枢的位置,即这些禾本科植物基因组的保守性可归结到水稻基因组的19个连锁区段上。由这19个区段可实现对所研究的全部禾谷类作物染色体的重建,并可构成一个禾谷类作物祖先种的染色体骨架。通过这一研究,人们对禾谷类作物的进化演变历程有了更深入的认识。植物比较基因组的研究成果表明,在更广的范围上,包括禾本科、十字花科、豆科植物及一些树木的基因组在基因组成和基因排列顺序上都存在很大程度的一致性。而在包括小麦、玉米和水稻等重要农作物的禾本科作物上,基因组成和排列顺序的一致性非常完好,人们可以在模式植物水稻上用图位克隆技术克隆相关物种的大多数重要基因。此外,比较基因组研究还给人们一个重要的启示,那就是模式植物上遗传作图的成果可推而广之,这对那些遗传作图工作相对滞后的植物尤其重要。比较基因组作图使建立高密度遗传连锁图可资利用的标记显着增加,从而大大提高获取离目标基因很近的分子标记的可能性。
比较基因组作图是利用分子标记技术在1个目标性状的分离群体中把目的基因定位于染色体的一定区域内,然后通过利用高密度的分子连锁分析,以精细定位目的基因。目前,作图的类型可分为2类,分别是遗传图谱和物理图谱。遗传图谱对图位克隆虽然非常重要,但更精细的物理图谱尤为重要。而增加图谱上的分子标记数目是精细作图的基础,增加分子标记的方法—是整合已有的遗传图谱,再者就是寻找新的分子标记。现在已有越来越多的植物的遗传图谱趋于饱和,如水稻已有3275个分子标记的图谱,覆盖基因组的1512.5 cM和10400个EST标记。目前利用稀有切点内切酶结合PEGE技术已成功用于植物基因组的大规模物理作图,从而可以确定连锁标记与目的基因间的实际物理距离的大小,为基因的克隆奠定了基础。 一旦把目标基因定位在某染色体的特定区域后,接下来就要对其进行精细的作图及筛选与目标基因紧密连锁的分子标记。目前的作图类型分为两类,分别是遗传图谱和物理图谱。
(1)遗传图谱的构建
染色体的交换与重组是遗传图谱构建的理论基础,通过作图群体的分析,如果一个基因与两侧最近的分子标记距离均在2 cM以上,就需要作精细的遗传图谱。因为即使是在小基因组水稻中,平均1 cM也相当于250 kb左右的物理距离,如果在着丝粒附近就可能相当于1000 kb左右,需要进行若干步的染色体步行,非常费时费力。因此,精细的遗传图谱对图位克隆显得非常重要,而增加遗传图谱上的分子标记数目是精细作图的基础。在一个已知区域内增加分子标记有两种方法,第一种方法是整合已有的遗传图谱。如将生理、生化、分子标记图在同一区域内整合在一起,就会提高分子标记的密度。另一种方法是寻找新的分子标记。在植物上,精细作图的发展速度超过了动物的同类研究,这主要是因为在植物上可很方便地建立和维持较大的分离群体,并建立了几种不同的检测标记间连锁关系的统计软件。现在,业已建图的植物已多达几十种,其中包括了所有重要的农作物(Tanksley,1995),如玉米、番茄、水稻、小麦、大麦、燕麦、大豆、高粱、油菜、莴苣、马铃薯等。尤其值得一提的是,过去被公认为难以开展遗传作图的木本植物,如今也涌现出了许多密度可观的分子标记连锁图,如苹果和松树等。由于许多科学家的共同努力和连年的工作积累,已有越来越多生物的遗传图谱趋于饱和,这就为生物的物理图谱的构建奠定了基础。
(2)物理图谱的构建
由于分子标记与目标基因之间的实际距离是按碱基数(bp)来计算的,它会因不同染色体区域基因重组值不同而造成与遗传距离的差别,所以物理图谱是真正意义上的基因图谱。物理图谱的种类很多,从简单的染色体分带图到精细的碱基全序列都是物理图谱。最为常用的物理图谱有限制酶切图谱、跨叠克隆群和DNA序列图谱等。限制酶切图谱是用几种限制性内切酶消化DNA,通过电泳检查限制性片段长度的办法确定它们的排列顺序;对于较大的基因组,可以利用稀有切点限制性内切酶和脉冲电脉。制作跨叠克隆群则需具有一定容量的大片段基因组文库。比较各个克隆的插人片段,将它们排列成与原来在染色体中的顺序一样的连续克隆群,即跨叠克隆群(也叫重叠克隆群)。
跨叠克隆群的制作方法有三种:
1)菌落杂交法。其基本原理是利用基因组某一区域特有的或与所需分离的目标基因紧密连锁的DNA分子标记为探针筛选大片段基因组文库,可以分别得到一系列的阳性克隆,这些克隆之间有部分片段是重叠的,根据其重叠部分可以把它们有序地呈线状排列成跨叠群(contig)。在两个跨叠群之间会出现空隙,需要通过染色体步行来填补。该技术从分离大片段阳性克隆群的左、右末端人手,以它们为探针再次筛选基因组文库,获得新的克隆即为沿着染色体向前走了一步,重复这一过程,就能一步一步地将空隙填满,将两个克隆群整合在一起,这一方法能利用各种分子标记扫描文库,准确得到携带分子标记的阳性克隆,是构建跨叠克隆群的首选策略。
2)PCR法。即以PCR技术为基础发展了一系列技术,包括STS、RAPD、AFLP和Alu-PCR等已被广泛应用于跨叠克隆群的构建。STS策略是利用已知核酸序列,从两端合成两个与其配对的引物,利用PCR进行扩增,理论上讲具有相同扩增带型的克隆,也可以说共享一个或数个STS位标的克隆肯定是跨叠的。这个方法具有简便、快速、精确度高等优点,是人类基因组计划所采用的主要策略之一。另一重要的基于PCR的策略是A1u-PCR技术,该技术利用人类基因组的Alu重复序列,合成一对特异性引物,进行PCR扩增,然后以PCR产物为探针,从文库中筛选出阳性克隆。这一方法简便,但有时会出现一些误差,当与限制性内切酶物理图谱结合使用时,就可以比较精确地排列出阳性克隆的重叠顺序。
3)DNA指纹—锚标法。其原理是首先对随机克隆的DNA选定一个6碱基识别位点的限制性内切酶消化,然后用放射性同位素进行末端标记,经标记后DNA片段用另一个4个碱基识别位点的限制性内切酶消化,用序列分析胶分离这些片段,然后经放射性自显影检测。这些指纹图谱数据经计算机处理后,根据片段的相似性,构建跨叠克隆群。
荧光原位杂交技术(Fiber-FISH)是最近几年新发展的方法,它使FISH技术的分辨力接近其理论值1 Kb,在光学显微镜的识别范围内。Fiber-FISH适宜于基因组的数量作图,而且由于可以在荧光显微镜下同时观察几种探针的位置和顺序,将有效地排除染色体步行过程中经常遇到的复重序列带来的因难。这些物理图谱的构建,无疑给图位克隆感兴趣的基因奠定了坚实的基础。
(3)构建高质量的基因组文库
在基因的图位克隆技术中,高质量的基因组文库的构建也是克隆成功的另一关键。图位克隆的基因组文库主要有Cos质粒文库和人工染色体(YAC)文库。作为被克隆的载体。可以采用Cos质粒,它是1种含有λ噬菌体的cos位点的质粒载体,大小在10 kb左右,可高效地克隆25~35 kb的DNA片段。当要克隆大片段DNA时。需要YAC作载体,以YAC为载体,可将300~1000 kb的DNA片段克隆:因此,以YAC为载体可以构建高等植物的完整基因组文库。除YAC外。后来又陆续发展了BAC、PAC等几种以细菌为寄主的载体系统。
图位克隆在理论上适用于任何物种,但目前主要还是用于真核生物。真核生物一般都有内含子,一个基因往往长达几个到几十个kb,只有容纳大片段插入子克隆载体,才能携带完整的基因。柯斯质粒从λ噬菌体改造而来,由于采用质粒的复制子,柯斯质粒克服了包装的限制,插人片段可达40~50 kb。虽然如此,柯斯质粒还是不敷应用,就又发展了人工染色体技术。人工染色体在细胞周期中可以正常复制,配对和分离。作为载体,人工染色体的插入片段可达2 Mb左右,能够覆盖完整的真核基因。最早发展的人工染色体是酵母人工染色体(YAC)。1983年,Murray等首次构建了总长度为55 kb的YAC。1987年,Burke等得到了能够克隆大片段DNA的YAC载体,证明YAC可以构建高等生物的完整基因组文库。YAC具有比较大的容纳能力,但不太稳定,嵌合体比例也较高,而且难以与酵母自身的染色体分开。后来陆续发展了P1、BAC、PAC等几种以细菌为寄主的载体系统。值得一提的是进展一直缓慢的哺乳动物人工染色体(MAC)和人类人工染色体(HAC)也已取得突破性进展。 找到与目标基因紧密连锁的分子标记(最好分布在基因两侧)和鉴定出分子标记所在的大片段克隆以后,接着是以该克隆为起点进行染色体步行,逐渐靠近目标基因,以该克隆的末端作为探针筛选基因组文库,鉴定和分离出邻近的基因组片段的克隆,再将这个克隆的远端末端作为探针重新筛选基因组文库。继续这一过程,直到获得具有目标基因两侧分子标记的大片段克隆或重叠群。如果目标基因所在区域已经完成分子作图,就有一套现成的顺序排列的大片段克隆可以利用。当遗传连锁图谱指出基因所在的特定区域时,即可取回需要的克隆,获得目标基因。
染色体步行的主要困难在于,当必须经过一个无法克隆的片段时(如对寄主无害),步行的过程会被打断;当克隆的一端是重复序列时,步行的方向会步入歧途。为了克服这些困难,发展了染色体登陆、跳步和连接等方法。染色体登陆是找出与目标基因的物理距离小于基因组文库插入片段的平均距离还小的分子标记,通过筛选文库直接获得含有目标基因的克隆,完全避开染色体步行的过程。染色体跳步—连接是使用一个识别位点很少的随机一个识别位点很多的酶构建跳步文库和连接文库。跳步文库的插入片段是大片段克隆末端经过双酶切的部分,由同样的文库进行克隆。连接文库的插入片段是由切点较少的酶产生的,具有切点较少的那个酶的识别位点。在染色体步行的过程中,交替应用两个文库进行跳步和连接,最终逼近目标基因。 筛选和鉴定目的基因是图位克隆技术的最后环节,找到与目的基因紧密连锁的分子标记并鉴定出分子标记所在的大片段克隆后,接着是以该克隆为起点进行染色体步行,逐渐靠近目的基因。当遗传连锁图谱指出基因所在的特定区域时,即可取回需要的克隆,获得目的基因。在与目的基因紧密连锁的分子标记及大插入片段基因组文库都具备的情况下,就可以以该分子标记为探针通过菌落杂交,蓝、白斑挑选的方式筛选基因组文库而获得可能含有因的基因的阳性克隆。在用覆盖目的基因区域的大片段基因组DNA克隆筛选区域特异的cDNA后,仍需对目的基因编码的cDNA作进一步证实。现有证实目的基因编码的cDNA克隆的方法有:1) 精细作图来证实某候选基因克隆与目标性状共分离; 2) 证实某候选基因克隆的时空表达模式与目标性状的表现相同;3) 把候选基因序列与现有已知功能基因序列数据库进行同源性比较,推断其功能;4) 比较候选基因序列在野生型与突变型之间的差异,确定在二者之间变异的cDNA序列;5) 转化候选基因。
这些阳性克隆中可能含有多个候选基因,从一系列候选基因中鉴定基因是定位克隆技术的最后一个关键环节。现在最常用的方法是用含有目标基因的大片段克隆如BAC克隆或YAC克隆去筛选cDNA文库,并查询生物数据信息库,待找出候选基因后,把这些候选基因进行下列分析以确定目标基因:1) 精确定位法检查cDNA是否与目标基因共分离;2) 检查cDNA时空表达特点是否与表型一致;3) 测定cDNA序列,查询数据库,以了解该基因的功能;4) 筛选突变体文库,找出DNA序列上的变化及与功能的关系;5) 进行功能互补实验,通过转化突变体观察突变体表型是否恢复正常或发生预期的表型变化。功能互补实验是最直接、最终鉴定基因的方法。
C. 什么是人类基因组计划
很长,不过很全,肯定有你想了解在里面!
人类基因组计划
中文名称:人类基因组计划
英文名称:human genome project;HGP;Human Genome Project
定义1:于20世纪80年代提出的,由国际合作组织包括有美、英、日、中、德、法等国参加进行了人体基因作图,测定人体23对染色体由3×109核苷酸组成的全部DNA序列,于2000年完成了人类基因组“工作框架图”。2001年公布了人类基因组图谱及初步分析结果。其研究内容还包括创建计算机分析管理系统,检验相关的伦理、法律及社会问题,进而通过转录物组学和蛋白质组学等相关技术对基因表达谱、基因突变进行分析,可获得与疾病相关基因的信息。
应用学科:生物化学与分子生物学(一级学科);总论(二级学科)
定义2:于20世纪80年代提出,由美、英、日、中、德、法等国参加并于2001年完成的针对人体23对染色体全部DNA的碱基对(3×109)序列进行排序,对大约25 000基因进行染色体定位,构建人类基因组遗传图谱和物理图谱的国际合作研究计划。 应用学科:细胞生物学(一级学科);总论(二级学科) 定义3:1990年由美国能源部(DOE)和国立健康研究院(NIH)资助的一个研究计划。目的是:① 鉴定出人类的所有基因;② 确定构成人类基因组的约30亿个碱基对的序列;③ 将上述信息储存于专门的数据库中,并开发出相应的分析工具;④ 研究由此而产生的伦理、法律和社会问题并提出相应对策。
应用学科:遗传学(一级学科);总论(二级学科)
以上内容由全国科学技术名词审定委员会审定公布
人类基因组计划人类基因组计划(human genome project, HGP)是由美国科学家于1985年率先提出,于1990年正式启动的。美国、英国、法兰西共和国、德意志联邦共和国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。按照这个计划的设想,在2005年,要把人体内约10万个基因的密码全部解开,同时绘制出人类基因的谱图。换句话说,就是要揭开组成人体4万个基因的30亿个碱基对的秘密。人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。
目录
简介
目的
诞生和启动
研究内容1、遗传图谱(genetic map)
2、物理图谱(physical map)
3、序列图谱
4、基因图谱
对人类的重要意义对人类疾病基因研究的贡献
对医学的贡献
对生物技术的贡献
对细胞、胚胎、组织工程的推动
对制药工业的贡献
对社会经济的重要影响
对生物进化研究的影响
带来的负面作用
应用实例1、疾病基因
2、药物靶
3、基础生物学
进展与未来完成人类基因组序列完成图
草图的作用
众多的发现
中国人类基因组研究概况
研究现状与展望研究现状
展望
人类基因组计划之塞雷拉人类基因组计划特点
基因的智慧财产权之争
后人类基因组计划简介
目的
诞生和启动
研究内容 1、遗传图谱(genetic map)
2、物理图谱(physical map)
3、序列图谱
4、基因图谱
对人类的重要意义 对人类疾病基因研究的贡献
对医学的贡献
对生物技术的贡献
对细胞、胚胎、组织工程的推动
对制药工业的贡献
对社会经济的重要影响
对生物进化研究的影响
带来的负面作用
应用实例 1、疾病基因
2、药物靶
3、基础生物学
进展与未来 完成人类基因组序列完成图
草图的作用
众多的发现
中国人类基因组研究概况研究现状与展望
研究现状 展望人类基因组计划之塞雷拉人类基因组计划
特点 基因的智慧财产权之争后人类基因组计划展开 编辑本段简介
1986年,诺贝尔奖获得者Renato Dulbecco发表短文《肿瘤研究的转折点:人类基因组测序》(Science, 231: 1055-1056)。文中指出:如果我们想更多地了解肿瘤,我们从现在起必须关注细胞的基因组。…… 从哪个物种着手努力?如果我们想理解人类肿瘤,那就应从人类开始。……人类肿瘤研究将因对DNA的详细知识而得到巨大推动。” 什么是基因组(Genome)?基因组就是一个物种中所有基因的整体组成。人类基因组有两层意义:遗传信息和遗传物质。要揭开生命的奥秘,就需要从整体水平研究基因的存在、基因的结构与功能、基因之间的相互关系。
编辑本段目的
人类基因组DNA草图
为什么选择人类的基因组进行研究?因为人类是在“进化”历程上最高级的生物,对它的研究有助于认识自身、掌握生老病死规律、疾病的诊断和治疗、了解生命的起源。 测出人类基因组DNA的30亿个碱基对的序列,发现所有人类基因,找出它们在染色体上的位置,破译人类全部遗传信息。 在人类基因组计划中,还包括对五种生物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。 HGP的目的是解码生命、了解生命的起源、了解生命体生长发育的规律、认识种属之间和个体之间存在差异的起因、认识疾病产生的机制以及长寿与衰老等生命现象、为疾病的诊治提供科学依据。
编辑本段诞生和启动
对人类基因组的研究在70年代已具有一定的雏形,在80年代在许多国家已形成一定规模。 人类基因组计划
1984年在Utah州的Alta,White R and Mendelsonhn M受美国能源部(DOE)的委托主持召开了一个小型专业会议讨论测定人类整个基因组的DNA序列的意义和前景(Cook Deegan RM,1989) 1985年5月在加州Santa Cruz由美国DOE的Sinsheimer RL主持的会议上提出了测定人类基因组全序列的动议,形成了美国能源部的“人类基因组计划”草案。 1986年3月,在新墨西哥州的Santa Fe讨论了这一计划的可行性,随后DOE宣布实施这一计划。 1986年,诺贝尔奖得主杜尔贝科(R. Dulbecco)在《科学》(Science)周刊撰文回顾肿瘤研究的进展,指出要么依旧采用“零敲碎打”的策略,要么从整体上研究和分析人类基因组。 1986年遗传学家McKusick V提出从整个基因组的层次研究遗传的科学称为“基因组学” 1987年初,美国能源部和国立卫生研究院为HGP下拨了启动经费约550万美元(全年1.66亿美元) 1988年,美国成立了“国家人类基因组研究中心”由Watson J出任第一任主任 1990年10月1日,经美国国会批准美国HGP正式启动,总体计划在15年内投入至少30亿美元进行人类全基因组的分析。 1987年,意大利共和国国家研究委员会开始HGP研究,其特点是技术多样(YAC,杂种细胞,cDNA等)、区域集中(基本上限于Xq24-qter区域) 1989年2月英国开始HGP,特点是:帝国癌症研究基金会与国家医学研究委员会(ICRP-MRC)共同负责全国协调与资金调控,剑桥附近的Sanger中心注重首先在线虫基因组上积累经验,改进大规模DNA测序技术;同时建立了YAC库的筛选与克隆、特异细胞系、DNA探针、基因组DNA、cDNA文库、比较生物基因组DNA序列、信息分析等的“英国人类基因组资源中心”。可谓“资源集中、全国协调”。 人类基因组遗传图
1990年6月法兰西共和国的HGP启动。科学研究部委托国家医学科学院制定HGP,主要特点是注重整体基因组、cDNA和自动化。建立了人类多态性研究中心(CEPH),在全基因组YAC重叠群、微卫星标记(遗传图)的构建以及驰名世界的用作基因组研究的经典材料CEPH家系(80个3代多个体家系)方面产生了巨大影响。 1990年,美国能源部(DOE)与国立卫生研究院(NIH)共同启动HGP,原定投入30亿美元,用15年时间完成该计划。英、日、法、德等国相继加入。 1995年德意志联邦共和国开始HGP,来势迅猛,先后成立了资源中心和基因扫描定位中心,并开始对21号染色体的大规模测序工作。 1990年6月欧共体通过了“欧洲人类基因组研究计划”,主要资助23个实验室重点用于“资源中心”的建立和运转。还有丹麦王国、俄罗斯联邦、日本、韩国、澳大利亚等。 1994年,我国HGP在吴旻、强伯勤、陈竺、杨焕明的倡导下启动,最初由国家自然科学基金会和863高科技计划的支持下,先后启动了“中华民族基因组中若干位点基因结构的研究”和“重大疾病相关基因的定位、克隆、结构和功能研究”, 1998年在国家科技部的领导和牵线下,1998年在上海成立了南方基因中心, 1998年5月11日,世界上最大的测序仪生产商美国PE Biosystems公司,以其刚研制成功的300台最新毛细管自动测序仪(ABI 3700)和3亿美元资金,成立了Celera Genomics公司,宣称要在3年内,以所谓的“人类全基因组霰弹法测序策略”完成人类基因组测序,并声称要专利200~400个重要基因,并将所有序列信息保密3个月。Celera公司已有雇员300多人,购买了号称“全球第三”的超大型计算机,号称拥有了超过全球所有序列组装解读力量总和的实力。就在六国共同宣布工作框架图构建完成的同一天,Celera公司宣称已组装出了完整的人类遗传密码。Celera公司此举,是对公益性的HGP的竞争与挑战 1999年在北京成立了北方人类基因组中心,1998年,组建了中科院遗传所。1999年7月在国际人类基因组注册,得到完成人类3号染色体短臂上一个约30Mb区域的测序任务,该区域约占人类整个基因组的1%。 人类基因组计划(Human genome project)由美国于1987年启动,我国于1999年9月积极参加到这项研究计划中的,承担其中1%的任务,即人类3号染色体短臂上约3000万个碱基对的测序任务。我国因此成为参加这项研究计划的唯一的发展中国家。2000年6月26日人类基因组工作草图完成。由于人类基因测序和基因专利可能会带来巨大的商业价值,各国政府和一些企业都在积极地投入该项研究,如1997年AMGE公司转让了一个与中枢神经疾病有关的基因而获利3.92亿美元。
编辑本段研究内容
HGP的主要任务是人类的DNA测序,包括下图所示的四张谱图,此外还有测序技术、人类基因组序列变异、功能基因组技术、比较基因组学、社会、法律、伦理研究、生物信息学和计算生物学、教育培训等目的。
1、遗传图谱(genetic map)
又称连锁图谱(linkage map),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。意义:6000多个遗传标记已经能够把人的基因组分成6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某一标记邻近(紧密连锁)的证据,这样可把这一基因定位于这一已知区域,再对基因进行分离和研究。对于疾病而言,找基因和分析基因是个关键。
第1代标记 经典的遗传标记,例如ABO血型位点标记,HLA位点标记。70年中后期,限制性片段长度多态性(RFLP),位点数目大与105,用限制性内切酶特异性切割DNA链,由于DNA的一个“点”上的变异所造成的能切与不能切两种状况,可产生不同长度的片段(等位片段),可用凝胶电泳显示多态性,从片段多态性的信息与疾病表型间的关系进行连锁分析,找到致病基因。如Huntington症。但每次酶切2-3个片段,信息量有限。 第2代标记 1985年,小卫星中心(minisatellite core)、可变串联重复VNTR(variable number of tandem repeats)可提供不同长度的片段,其重复单位长度为6至12个核苷酸 ,1989年微卫星标记(microsatellite marker)系统被发现和建立,重复单位长度为2~6个核苷酸,又称简短串联重复(STR)。 第3代标记 1996年MIT的Lander ES又提出了SNP(single nucleotide polymorphysm)的遗传标记系统。对每一核苷酸突变率为10-9,双等位型标记,在人类基因组中可达到300万个,平均约每1250个碱基对就会有一个。3~4个相邻的标记构成的单倍型(haplotype)就可有8~16种。
2、物理图谱(physical map)
物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。DNA物理图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。因限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。因此,DNA物理图谱是DNA分子结构的特征之一。DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图。广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法──标记片段的部分酶解法,来说明图谱制作原理。 用部分酶解法测定DNA物理图谱包括二个基本步骤: (1)完全降解 选择合适的限制性内切酶将待测DNA链(已经标记放射性同位素)完全降解,降解产物经凝胶电泳分离后进行自显影,获得的图谱即为组成该DNA链的酶切片段的数目和大小。 (2)部分降解 以末端标记使待测DNA的一条链带上示踪同位素,然后用上述相同酶部分降解该DNA链,即通过控制反应条件使DNA链上该酶的切口随机断裂,而避免所有切口断裂的完全降解发生。部分酶解产物同样进行电泳分离及自显影。比较上述二步的自显影图谱,根据片段大小及彼此间的差异即可排出酶切片段在DNA链上的位置。下面是测定某组蛋白基因DNA物理图谱的详细说明。 完整的物理图谱应包括人类基因组的不同载体DNA克隆片段重叠群图,大片段限制性内切酶切点图,DNA片段或一特异DNA序列(STS)的路标图,以及基因组中广泛存在的特征型序列(如CpG序列、Alu序列,isochore)等的标记图,人类基因组的细胞遗传学图(即染色体的区、带、亚带,或以染色体长度的百分率定标记),最终在分子水平上与序列图的统一。 基本原理是把庞大的无从下手的DNA先“敲碎”,再拼接。以Mb、kb、bp作为图距,以DNA探针的STS(sequence tags site)序列为路标。1998 年完成了具有52,000个序列标签位点(STS),并覆盖人类基因组大部分区域的连续克隆系的物理图谱。构建物理图的一个主要内容是把含有STS对应序列的DNA的克隆片段连接成相互重叠的“片段重叠群(contig)”。用“酵母人工染色体(YAC)作为载体的载有人DNA片段的文库已包含了构建总体覆盖率为100%、具有高度代表性的片段重叠群”,近几年来又发展了可靠性更高的BAC、PAC库或cosmid库等。
3、序列图谱
随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。 大规模测序基本策略 逐个克隆法 对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)。 全基因组鸟枪法 在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)。 基因图谱
4、基因图谱
基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。在人类基因组中鉴别出占具2%~5%长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。 原理 所有生物性状和疾病都是由结构或功能蛋白质决定的,而已知的所有蛋白质都是由mRNA编码的,这样可以把mRNA通过反转录酶合成cDNA或称作EST的部分的cDNA片段,也可根据mRNA的信息人工合成cDNA或cDNA片段,然后,再用这种稳定的cDNA或EST作为“探针”进行分子杂交,鉴别出与转录有关的基因。用PolyA互补的寡聚T或克隆载体的相关序列作为引物对mRNA双端尾侧的几百个bp进行测序得到EST(表达序列标签)。2000年6月,EMBL中EST数量已有4,229,786。 基因图谱的意义 在于它能有效地反应在正常或受控条件中表达的全基因的时空图。通过这张图可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。 人类基因组是一个国际合作项目:表征人类基因组,选择的模式生物的DNA测序和作图,发展基因组研究的新技术,完善人类基因组研究涉及的伦理、法律和社会问题,培训能利用HGP发展起来的这些技术和资源进行生物学研究的科学家,促进人类健康。
编辑本段对人类的重要意义
对人类疾病基因研究的贡献
人类疾病相关的基因是人类基因组中结构和功能完整性至关重要的信息。对于单基因病,采用“定位克隆”和“定位候选克隆”的全新思路,导致了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。对于心血管疾病、肿瘤、糖尿病、神经精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重点。 健康相关研究是HGP的重要组成部分,1997年相继提出:“肿瘤基因组解剖计划”“环境基因组学计划”。
对医学的贡献
基因诊断、基因治疗和基于基因组知识的治疗、基于基因组信息的疾病预防、疾病易感基因的识别、风险人群生活方式、环境因子的干预。
对生物技术的贡献
胚胎细胞克隆羊——多利
(1)基因工程药物 分泌蛋白(多肽激素,生长因子,趋化因子,凝血和抗凝血因子等)及其受体。 (2)诊断和研究试剂产业 基因和抗体试剂盒、诊断和研究用生物芯片、疾病和筛药模型。
对细胞、胚胎、组织工程的推动
胚胎和成年期干细胞、克隆技术、器官再造。
对制药工业的贡献
筛选药物的靶点:与组合化学和天然化合物分离技术结合,建立高通量的受体、酶结合试验以知识为基础的药物设计:基因蛋白产物的高级结构分析、预测、模拟—药物作用“口袋”。 个体化的药物治疗:药物基因组学。
对社会经济的重要影响
生物产业与信息产业是一个国家的两大经济支柱;发现新功能基因的社会和经济效益;转基因食品;转基因药物(如减肥药,增高药)
对生物进化研究的影响
生物的进化史,都刻写在各基因组的“天书”上;草履虫是人的亲戚——13亿年;人是由300~400万年前的一种猴子进化来的;人类第一次“走出非洲”——200万年的古猿;人类的“夏娃”来自于非洲,距今20万年——第二次“走出非洲”?
D. 物理图谱的构建方法主要有哪几种
物理图谱的构建方法主要有哪几种
研究物理的科学方法有许多,经常用到的有观察法、实验法、比较法、类比法、等效法、转换法、控制变量法、模型法、科学推理法等.研究某些物理知识或物理规律,往往要同时用到几种研究方法.如在研究电阻的大小与哪些因素有关时,
E. 生物学 EST是什么啊 详细的介绍一下
EST是Expressed Sequence Tag的缩写,意思是表达序列标签,指从一个随机选择的cDNA克隆,进行5’端和3’端单一次测序挑选出来获得的短的cDNA 部分序列。
EST是从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的短的cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。
EST 来源于一定环境下一个组织总mRNA 所构建的cDNA 文库,因此EST也能说明该组织中各基因的表达水平。
(5)为什么要构建物理图谱扩展阅读
EST的作用表现在:
1、 用于构建基因组的遗传图谱与物理图谱;
2、作为探针用于放射性杂交;
3、 用于定位克隆;
4、借以寻找新的基因;
5、作为分子标记;
6、 用于研究生物群体多态性。