Ⅰ 什么是遗传图谱和物理图谱
遗传图谱:某一物种的染色体图谱(也就是我们所知的连锁图谱),显示所知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。采用遗传学分析方法将基因或其它DNA标记按一定的顺序排列在染色体上,这一方法包括杂交实验,家系分析。标记间的距离(遗传图距)用减数分裂中的交换频率来表示,单位为厘摩Centi-Morgan,
cM),
每单位厘摩定义为1%交换率。遗传学图谱的解像度(分辨率)低,大约只能达到100万碱基对(1Mb)的水平。
物理图谱:顾名思义,是DNA中一些可识别的界标(如限制性酶切位点、基因等)在DNA上的物理位置,图距是物理长度单位,如染色体的带区、核苷酸对的数量等
两者异同:
①遗传图谱是基于重组频率,物理图谱是基于直接测量的DNA结构。
②减数分裂重组的频率并不统一沿大多数染色体。有一些热点和冷点在重组和
/或突变。热点和冷点会导致相当大的格律失真时,遗传图谱和物理地图并排排列时。
③遗传图谱表示的是基因或标记间的相对距离,以重组值表示,单位CM
④物理图谱表示的是基因或标记间的物理距离,距离的单位为长度单位,如μm或者碱基对数(bp或kp)等。
简而言之
前者是描述的基因相对位置,后者是具体的碱基位置
二者存在的意义:
通过遗传图谱,
我们可以大致了解各个基因或DNA片断之间的相对距离与方向,如哪个基因更靠近着丝粒,那个更靠近端粒等。遗传图谱不仅是现阶段定位基因的重要手段,
即使在人类基因组全物理图谱建立起来之后,它依然是研究人类基因组遗传与变异的重要手段
Ⅱ 基因组图谱——遗传图与物理图
遗传图是随染色体部分连锁的发现而发明的。
一条染色体上有许许多多的基因,减数分裂中同源染色体分离,一条染色体上的基因在理想状态上应一起分配给配子,然而事实并非如此。因为在减数分裂第一次分裂前期染色单体会发生断裂以及DNA片段的交换,从而发生染色体的部分连锁现象。测序发明以前,基因连锁或部分连锁都是通过表型观察确定的。
对于部分连锁,人们早期通过表型发现 不同基因间 连锁发生的频率有差异。于是摩尔根的学生Arthur Sturtevant假设染色单体特定位点交换是一个随机事件,在一对并列的染色单体的任何位置发生交换的概率是相同的。基于以上假设,相邻的两个基因由于交换而分开的概率将低于距离较远的两个基因(因为相邻基因即便交换也更偏向于一起)。进一步说,基因间因交换而失去连锁的概率与它们在染色体上的距离成比例。因此用重组频率(recombination frequency)可衡量两个基因间的距离。通过计算不同基因对之间的重组频率,就能构建出显示基因在染色体上相对位置的图(遗传图)。
遗传图的缺陷: 遗传图的分辨率依赖于所得到的交换数目 。对于人类及其他大多数高等真核生物来说,不可能获得巨大数量的后代由于遗传学研究。 遗传图的准确率有限 。Sturtevant的假说认为交换在染色单体上随机发生,但由于重组热点的存在,使这一假说不完全正确。为获取更精确的基因组图谱,物理图的绘制方法被发明出来。其中最重要的为: 限制性作图(restriction mapping)、荧光原位杂交(fluorescent in situ hybridization, FISH)、序列标记位点(STS)作图(sequence tagged site mapping) 。
该方法的基本思想是比较一个DNA分子被两种识别不同靶序列的限制酶切割所产生的片段的大小,切割产物可用电泳检测(图1)。对于无法确定顺序的片段,可通过 部分限制性酶切 (partial restriction)的方法产生一套含有部分消化的产物,以此分析片段的可能排序。还有一种改进的方法(图2),即在部分消化前将放射性或其他类型标记物加到要分析的DNA分子两端,于是在荧光指导下对可见酶切片段进行排序,简化了部分酶切的筛选流程。
限制性作图的规模受限于限制性片段的大小 。由于限制性位点在DNA序列中多而密集,使得消化产物在琼脂糖凝胶中重叠或发散。因此限制性作图最适用于小分子。当然也可依靠某些“ 稀有酶 ”进行切割,获取较小数量的片段。如能特异性识别7个或8个核苷酸的 Sap I、 Sgf I。对于GC含量为50%的DNA分子,这些7核苷酸酶平均每4^7=16384bp有一个切点。除“稀有酶”外,还有某些特异性序列对人类基因组而言存在较少,利用这类序列相对应的限制性内切酶进行切割,也能获得类似的结果。
由于使用“稀有酶”制作长序列片段,普通的电泳无法胜任对它们的分离工作,因为长片段容易缠绕,分子间作用更频繁。为此,必须使用更复杂的电场代替普通的线形电场。例如, 正交变电场凝胶电泳 (orthogonal field alternation gel electrophoresis, OFAGE)等。
除电泳外,还可利用其它方法对DNA分子的限制性位点作图。可以通过直接在显微镜下观察检测限制性酶切位点,这一技术称为 光学作图 (optical mapping),常用的两种方法是 凝胶拉伸 (gel stretching)与 分子梳理 (molecular combing)(图3)。制作好的DNA纤维,利用荧光染料染色,再用限制性酶切割,通过荧光显微镜便可观察到切口的相对位置。
与光学作图类似,FISH能够直接显示标记序列在染色体或伸展的DNA分子上的位置。在FISH中,标记物是一段DNA序列,通过用荧光探针与其杂交而显现出来。应用该方法时,需打开维持染色体DNA双螺旋结构的碱基配对,以使其形成单链分子(即DNA“变性”),只有这样才能形成杂交。 使染色体DNA变性而不破坏其形态的标准方法是将染色体在载玻片上干燥,再用甲酰胺处理 。
如果探针是长的DNA片段,便可能存在一些重复的DNA序列(DNA序列中间隔存在的串联或非串联重复片段),因此探针可能与染色体上的多个位点杂交,而不仅仅发生在其精确匹配的特异性位点上。为降低这种非特异性杂交,探针在使用前要与来自被研究组织中的未标记DNA混合,于是加入富含重复序列的片段,来锁闭探针中的重复序列。这样,便使得原位杂交反应完全由单一的序列驱动。
一次FISH实验仅能获得不超过3个或4个标记的图谱位点,数据积累慢,耗时长。因此,要使详细的物理图谱成为现实,需要更有效率的技术。目前最有效的作图技术,也是能对大型基因组产生最详尽图谱的技术,是 STS作图 。一个序列标记位点(STS)是一段短的DNA序列,通常为100-500bp,易于识别,且在拟研究的染色体中仅出现一次。完成一套STS图谱需要收集来自单条染色体或一个完整染色体或基因组的重叠的DNA片段。
其基本原理如下图所示(图5)。在收集作图必需的数据时,需排列每一个STS,了解哪些片段包含有哪些STS。这些可以通过杂交分析来完成,但通常会使用PCR的方法,因为PCR更快捷。具体方法为将研究所用的DNA随机打断(需有6套一致的DNA片段供打断),然后依次采用单个STS检测它们所在的DNA片段,其中STS为人工合成并带有荧光标记,通过PCR在含有STS配对的片段上延伸。若两个STS距离足够近,那么它们出现在同一片段的概率将较大,利用荧光显微镜可以在多条片段上观察到间隔一致的两个标记。反之,两个标记距离越远,位于同一片段的概率就越小。实际上,与连锁分析计算图距的方式类似,STS图距是根据 分离频率 计算的,而不是观测到的影像距离,因为距离相近的标志物利用信号的有无作频率判别的依据较距离观测更容易、也更精确。基于此,以STS为物理标志的物理图谱得以完成。
以上过程留有两个需要补充说明的问题。
第一关于 STS的选择 。任何一个唯一的DNA序列均可作为STS,但需满足两个条件。首先, 它的序列必须是已知的 ,以便用PCR方法检测该STS在不同DNA片段中存在与否。其次, STS必须在拟研究的染色体上有唯一的定位 ,如果是多拷贝,将无法准确获取各标志物间的物理距离。
第二关于 STS作图的DNA片段 。其一来源是像前面所说的通过随机打断构建的文库。打断全DNA目前常用两种方法: 超声打断 和 酶打断 。超声打断一般使用的仪器为Covaris系列,酶打断可用片段化酶。这种随机打断的序列片段拥有重叠区,因而能组成克隆重叠群(clone contig),从而具备构建克隆文库的条件。只需将随机片段克隆到适当载体上,便制成了多个克隆文库的集合(起初有几套DNA就有几个克隆文库)。反之若拥有目的DNA的 克隆文库 ,与支持测序工作一样,它们也可用作STS分析。第二种来源是 放射杂交体 (radiation hybrid),这是种含有其他生物体染色体片段的啮齿类动物细胞。这项技术首先发展于20世纪70年代,当时人们发现将人类细胞暴露于3000-8000拉德剂量的X射线中,会使染色体随机断裂成碎片,放射剂量越大,产生的片段越小。这种处理对人类细胞是致死的,但若将瘦果照射的细胞与未经照射的仓鼠细胞或其他啮齿类细胞融合后,染色体碎片可以传递给后者。可利用化学试剂(如聚乙二醇)处理或暴露于仙台病毒中促进两种细胞融合。这种方法为STS作图提供所需的DNA片段,在人类基因组计划作图阶段发挥了重要作用。但实验对象似乎集中于动物。
总言之,基因组图谱绘制的方法多种多样,可以说各种图谱所能反应的DNA信息各不相同,各有其独到之处。例如STS图谱最为精确,但仍可能未包括所有的限制性位点,且其定位的DNA片段没有针对性,而限制性图谱则能将有用的限制性位点进行精准标定,尽管其要实现大序列片段的标定较为困难。又荧光原位杂交所得图谱较STS作图更直观,也更具针对性,操作不算复杂。与物理图谱相比,遗传图谱出现较早,精度与分辨率不高,但其绘图思想为STS作图提供思路,即凭借表型显隐性或信号的有无,计算频率,绘制图谱。
基因组图谱绘制有什么用?这在上述技术发明的初期恐怕未能明了。但随DNA测序的提出,以及不再是遥不可及的概念时,人们意识到基因组图谱能为测序提供框架。这是因为高等真核生物全基因组往往存在大量的重复区域,简单的重叠区拼接会在这些区域发生错位。因此事先绘制的图谱中,覆盖全基因组的各类标志物,无论是基因、限制性位点、STS位点等都能发现并对错误进行校正,基因组图谱能为后续基因组拼接与组装提供极大便捷。此外,将测序结果与基因组图谱结合,能将基因及其他有意义的特征定位于DNA序列中,以便后续开展限制性酶切、功能分析、遗传诊断等各方面的研究。早期对不同序列位点的研究成果积累,以及测序技术发展后对不同类群模式物种及相关物种全基因组序列的获取,才得以掌握大量基因组、转录组的信息。
既然基因组图谱能为所测序列的拼接组装提供参考,那么作图是测序的必要前提吗?关于这个问题,待更新至测序相关篇章时再做解答较合适。但就目前已知,小基因组的测序如细菌等,运用鸟枪法便能完整拼接,无需通过图谱校正。
[1] T. A. 布朗. 基因组3[M]. 第一版. 北京: 科学出版社, 2009.
[2] 田雨. 基于单拷贝序列的桑树染色体荧光原位杂交分析[D]. 西南大学, 2021. DOI:10.27684/d.cnki.gxndx.2021.002123.
Ⅲ 遗传图与物理图是如何整合的
前者是描述的基因相对位置,后者是具体的碱基位置
遗传图谱是某一物种的染色体图谱(也就是我们所知的连锁图谱),显示所知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。由遗传重组测验结果推算出来的、在一条染色体上可以发生的突变座位的直线排列(基因位点的排列)图。
物理图谱是利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离[碱基对(bp) 或千碱基(kb)或兆碱基(Mb)]的图谱。以人类基因组物理图谱为例,它包括两层含义,一是获得分布于整个基因组30 000个序列标志位点(STS,其定义是染色体定位明确且可用PCR扩增的单拷贝序列)。
基因定位:通过遗传杂交、绘制图谱或探针杂交等手段确定基因在染色体上的相对和绝对位置,是遗传学研究中的重要环节,研究生物的基因在染色体上的位置和生理功能之间的关系
物理图谱:表示某些基因与遗传标志之间在基因组上的直线相对位置和距离的图谱,可以用来识别的标记包括限制性内切酶的酶切位点,基因等
遗传图谱:由遗传重组测验结果推算出来的、在一条染色体上可以发生的突变座位的直线排列图,如果同一条染色体上的两个基因相对距离越长,那么他们减数分裂发生重组的概率将越大,共同遗传的概率也就越小。因此可以根据他们后代性状的分离可以判断他们的交换率,也就可以判断他们在遗传图谱上的相对距离