① sanger加减法核酸序列分析的原理
DNA序列测定技术(双脱氧末端终止法)使用须知
(张宏、李振甫)
一、背景介绍
目前最常用的手工DNA序列测定技术,仍然是Sanger等(1977)提出的酶法,也称双脱氧末端终止法。这种方法生成相互独立的若干组带放射性标记的寡核苷酸,每组核苷酸都有共同的起点,却随机终止于一种(或多种)特定的残基,形成一系列以某一特定核苷酸为末端的长度,各不相同的寡核苷酸混合物,这些寡核苷酸的长度由这个特定碱基,在待测DNA片段上的位置所决定。然后通过高分辨率的变性聚丙烯酰胺凝胶电泳,经放射自显影后,从放射自显影胶片上,直接读出待测DNA上的核苷酸顺序。
高分辨率变性聚丙烯酰胺凝胶电泳,亦是DNA序列测定技术的重要基础,可分离仅差一个核苷酸、长度达300-500个核苷酸的单链DNA分子。DNA序列测定的简便方法,为详细分析大量基因组的结构和功能奠定了基础,时至今日,绝大多数蛋白质氨基酸序列都是根据基因或cDNA的核苷酸序列推导出来的。
除传统的双脱氧链终止法外,自动化测序实际上已成为当今DNA序列分析的主流。此外,新的测序方法亦在不断出现,如上世纪90年代提出的杂交测序法等。
二、双脱氧末端终止法测序步骤
(一)制备模板
有两种类型的DNA可以作为Sanger法测序的模板,即纯化的单链DNA和经热变性或碱变性的双链DNA。
1、单链DNA模板 在一般情况下,可将靶DNA片段克隆于M13mp载体中,从M13mp系列噬菌体颗粒中分离得到的单链DNA模板效果最佳,只要细心掌握模板与引物的最佳比例,有经验的测序人员通过一次末端终止反应,能读取300-500个核苷酸序列。
2、经热变性或碱变性的双链DNA模板 利用双链质粒模板测序,其中有两个至关重要的因素,即模板的质量和聚合酶的种类。用小量制备的质粒DNA来测定未知序列的DNA克隆,往往因为有污染而并不可取。高纯度的质粒最好采用氯化铯-溴乙锭梯度平衡超速离心法制备。其次是应采用高质量的聚合酶。一次末端终止反应亦可能读出300核苷酸序列。
(二)引物
酶法测序反应中都有一个与模板链特定序列互补的寡核苷酸作为DNA合成的引物。不管是单链DNA作模板,还是用变性双链DNA作模板,都有通用引物可用,而不必另行设计与未知DNA序列互补的引物。通用引物可直接从厂商购买。
(三)DNA测序酶
该酶是一种经过化学修饰的T7噬菌体DNA聚合酶,是测定较长DNA的首选酶。市售的各种以该酶为基础的测序试剂盒,效果甚佳。
(四)放射性标记
传统的DNA测序方法都采用α-32P-dNTP作为放射性标记物,但由于32p发射的高能β射线,常会引起二个问题:首先是放射自显影图谱条带扩散、分辨率低,限制了识读序列的数量和准确性;其次是32P衰变会导致DNA样品分解,通常都应在测序反应后24小时内进行电泳,否则无法获得好的结果。
近年来α-35S-dNTP被广泛采用,是由于35S产生较弱的射线,克服了32P的二大缺点。放射自显影图谱具有较高的分辨率和较低的本底,测序反应产物可在-20℃保存一周,而分辨率并不下降。
(五)测序胶的准备及电泳
1、硅化玻璃板
2、配置电泳试剂和缓冲液
3、凝胶液的配置
4、电泳
5、电泳后凝胶的处理
(六)DNA序列的识读
DNA序列的识读: ①在显影前后一定要注意标明模板名称、日期和测序人等,并标明各套反应位置;②识读时从显而易见的特征序列开始,如连续的同聚核昔酸(如TTTTT、AAAAA)或交替出现的嘌呤和嘧啶(如GTGTGTGT),一旦找到这种序列,便可较快地确定目的序列的位置。
三、注意事项
尽管核酸序列测定方法越来越成熟、简便并且可以自动化,但事实上,对于一个片段较长、序列未知的待测核酸而言,仍然是一件耗时且繁琐的工作。对于一个待测DNA分子,要制定一个能够简捷准确的测定方案,一般可以从以下几个方面考虑:
1、DNA片段大小。
2、背景资料:是否清楚DNA限制性酶切图谱,是否有一段已知序列,是否具有重复序列等。
3、测序目的: ①测定未知序列;②确定重组DNA的方向与结构;③对突变(如点突变)进行定位和鉴定;④比较性研究,如比较同种病毒不同株系之间的基因差异。后3种测序目的称为确证性测序。
4、实验条件:如手工测序还是自动化测序,合成引物费用等。
由于单套测序反应所能准确测定的DNA序列最长一般仅300-400bp。因此,在进行序列测定之前,必须首先考虑待测DNA分子的大小,其次是所要测定的序列范围以及要求的序列精确程度等,再结合实验室的条件选择切实可行的克隆及测序方案。
DNA序列如何测定
一、常规DNA测序的原理
制作物理图谱的过程是一个逐步精细的过程。第一步把每条染色体分成平均长度在400kb的长片段,每段克隆到一个YAC上,所有YAC克隆都按照其在染色体上的实际位置进行排序,我们就得到了一个能够覆盖整个染色体的YAC文库。
把每一个YAC克隆携带的染色体片段经部分酶切形成一系列有重叠区域的40kb左右的片段克隆到粘粒上,得到粘粒文库。每个粘粒上的染色体片段再经酶切形成4kb左右的片段克隆到测序专用的质粒载体上。测序质粒上携带的4kb的片段就可以用现在常规测序的方法进行测序了。把所有质粒克隆的DNA片段序列读出,再按照各个片段在染色体上的实际位置进行排列,最后就可以得到染色体的全部核苷酸碱基对序列。染色体的DNA碱基序列是基因组物理图谱的最精细形式。
所谓“常规测序方法”的基本特点有两个:第一,把待测序的DNA分子进行处理,得到每个只差1个核苷酸的一系列逐步缩短的DNA分子的混合物;第二,通过凝胶电泳把这些DNA分子分离开来,形成阶梯状排列的条带,然后逐个读出DNA的碱基序列。
二、化学法测序
得到长度只差一个碱基的DNA分子的方法主要有两种。一种是用化学方法把待测序的DNA片段在每个碱基处切断一次。这是由Maxam和Gilbert发明的方法。具体做法是把待测序的DNA分子成单链分子,其5’端用32p进行放射性标记。然后把这些单链DNA分于分成4份,每份用一种化学试剂处理DNA片段,每种试剂可使DNA分子在一种碱基的5’端的磷酸二酯键处发生断裂。例如,试剂一可使单链DNA分子在A碱基处断裂,试剂二可使单链DNA分子在T碱基处断裂,依此类推。把反应条件控制好,使每个DNA分子只发生一次断裂,这样,我们就得到4种反应产物,每种由在一种碱基处发生断裂形成的DNA片段组成。
把这4种反应产物用聚丙烯凝胶电泳进行分离,两个DNA片段只要相差1个碱基,就可以在这种凝胶中被分成两个条带。电泳完成后,用X光胶片进行曝光,最后得到一张由不同条带组成的序列图。从这张图上就可以读出待测DNA片段的碱基序列。5’端的第一个碱基G读不出来,可以通过测定互补链的序列测出这个碱基。
三、酸法测序与测序的自动化
另外一种得到长度只差一个碱基的DNA分子的方法是英国科学家桑格发明的,这种方法利用DNA聚合酶以待测序的DNA单链分子为模版合成互补的新链。在合成新链时,合成原料除了4种脱氧核糖核苷酸外还加入一种2’和3’位上的羟基都脱除的核苷酸。由于缺少3’羟基,当这种核苷酸被结合到链上后,它的后面不能再结合其他核苷酸,链的合成就此终止。与化学法测序类似,我们可以准备4种反应物,加入的核苷酸类似物分别携带A,G,C,T碱基,每种反应物里包含在一种碱基处终止链延伸的长短不同的DNA片段。这些DNA片段也要用放射性标记,经过凝胶电泳和放射自显影,得到DNA条带图谱,根据图谱可以读出DNA的碱基序列。
这种方法比化学法简单,条件易于控制。用4种不同的荧光化合物分别标记4种反应的产物,就可以做到把4种反应物混合在一起进行电泳,可以提高电泳分析的效率。这种方法利用现代精密仪器和机器人技术可以实现DNA测序的高度自动化。目前市场上已经有各种型号的DNA自动测序仪可供选购。
根据最新计划,到2000年人类基因组的“草稿”要出来。这个“草稿”包含了90%的人类基因组的序列,每个区域测定5次左右。到2003年完整的人类基因组序列测定可以完成,这个序列可以作为“参考基因组”或者“标准基因组”用于生物医学研究。测定这个“标准基因组”所用的DNA是由10到20位志愿者提供的,用男性的精子DNA和女性的血液DNA作为样品构建了人的基因组文库,因此,“标准基因组”序列不是哪一个具体的人的序列,而是几十位志愿者的序列的综合体现。
四、单分子荧光测序
单分于荧光测序是一种快速DNA测序法,这是利用单分子操作技术直接读取DNA的碱基序列的方法,与传统的荧光测序法相比,这种方法可大大提高速度。用桑格测序方法现在每天可以解读上万个碱基序列,但是如果单分子荧光测序取得成功,它可以在两分钟内完成传统方法一天的工作。
单分于荧光测序的主要过程如下。第一步,取一条大约有5万个碱基那么长的单链DNA分子,把它的一端用化学方法连接在一个非常微小的塑料球上,DNA分子就会缠绕在塑料球上。第二步,在一张类似激光唱片的圆盘上铺一层很薄的液体薄膜,然后用激光光钳把塑料球放在这张光盘的液体膜上进行移动,DNA分子就会在后面被拖着展开,就好像一只船拖着一条绳子快速前进,把绳子拉展一样。第三步,让拉展的的DNA分子与一种核酸外切酶结合。这种核酸外切酶可以和DNA的游离的末端结合,然后逐个把DNA的碱基切割下来。第四步,用单分子光谱技术逐个识别并且读出碱基即达到了测序的目的。
目前,单分子荧光测序技术还没有完全成熟。主要问题是用于识别单个碱基的单分子光谱技术还没有过关。利用隧道扫描显微镜和原子力显微镜直接读取DNA分子碱基序列的研究也正在进行之中,近期内有可能取得突破。
五、DNA芯片与杂交测序
DNA芯片是一种通过杂交测定未知DNA序列的新技术。在一个玻璃或硅片上合成大量的寡聚核苷酸片段,例如可以合成8个碱基长的全部可能的寡聚核苷酸片段(48=65,536种)。这些探针一头固定在固体基质上,另外一端是游离的。它们在硅片上有规律地排列着,每个特定位置上探针的序列都是已知的。
假如有一个DNA片段需要测序,我们可以把它的单链形式用荧光进行标记,然后与硅片上的6万多种探针进行分子杂交,在荧光显微镜下观察杂交结果。如果某个探针与持测DNA的某个部分的序列是完全互补的,待测DNA分子就被结合到硅片上,这个探针所在的位置就会发出荧光。这种包含大量的生物遗传信息的寡聚核着酸阵列就叫DNA芯片,也叫基因芯片。
DNA芯片的制备要利用微电子芯片生产中的光刻技术以及在位组合化学技术。DNA芯片的阅读要使用显微术,信息的解读要利用计算机技术。因此,DNA芯片是多学科交叉的产物。
参考资料:http://www.wsjk.com.cn/gb/paper124/1/class012400001/hwz92638.htm
② 核酸和蛋白质序列分析的内容和方法有哪些
核酸和蛋白质序列分析的内容和方法有哪些
蛋白质结构分析方法:X射线晶体衍射分析和核磁共振
x 射线衍射法的分辨率可达到原子的水平,使它可以测定亚基的空间结构、各亚基间的相对拓扑布局,还可清楚的描述配体存在与否对蛋白质的影响。多维核磁共振波谱技术已成为确定蛋白质和核酸等生物分子溶液三维结构的唯一有效手段。NM R技术最大的优点不在于它的分辨率,而在于它能对溶液中和非晶态的蛋白质进行测量。
蛋白质的序列结构测定:
1.到目前为止,最经典的蛋白质的氨基酸序列分析方法是,sarI等人基于Edman降解原理研制的液相蛋白质序列仪,及后来发展的固相和气相的蛋白质序列分析仪。
2.质谱:早期的质谱电离的方式主要是电子轰击电离(EI),它要求样品的挥发性好,一般与
气相色谱联用。但使用G C/M S分析,肽的长度受到限制,只能分析小的肽段。近年来,
在离子化的技术及仪器方面取得了突破性进展,使得质谱所能测定的分子量的范围大大超
出了10k u。因此,软离子化技术、基质辅助的激光解吸/离子化(MALDI)和电喷雾离子化(E SI)显得尤为有前途。通过串联质谱技术(MS/MS)和源后衰减基质辅助的激光解吸/离子化(PSD—MAIDI—MS),人们就可以从质谱分析中获得肽及蛋白质的结构信息。
③ 说明酶法测核酸序列的原理
利用大肠杆菌DNA聚合酶Ⅰ,以单链DNA为模板,并以与模板事先结合的寡聚核苷酸为引物,根据碱基配对原则将脱氧核苷三磷酸(dNTP)底物的5′-磷酸基团与引物的3′-OH末端生成3′,5′-磷酸二酯键。通过这种磷酸二酯键的不断形成,新的互补DNA得以从5′→3′延伸。Sanger引入了双脱氧核苷三磷酸(ddTNP)作为链终止剂。ddTNP比普通的dNTP在3′位置缺少一个羟基(2′,3′-ddNTP)(图7-4-1),可以通过其5′三磷酸基团掺入到正在增长的DNA链中,但由于缺少3′-OH,不能同后续的dNTP形成3′,5′-磷酸二酯键。因此,正在增长的DNA链不再延伸,使这条链的延伸终止于这个异常的核苷酸处。这样,在4组独立的酶反应体系中,在4种dNTP混合底物中分别加入4种ddNTP中的一种后,链的持续延伸将与随机发生却十分特异的链终止展开竞争,在掺入ddTNP的位置链延伸终止。结果产生4组分别终止于模板链的每一个A、每一个C、每个G和每一个T位置上的一系列长度的核苷酸链。通过高分辨率变性聚丙烯酰胺凝胶电泳,从放射自显影胶片上直接读出DNA上的核苷酸顺序。