NGS原理解析:二代测序流程
一、二代测序简介
1.第二代测序(Next-generation sequencing,NGS):又称为高通量测序(High-throughput sequencing),是基于PCR和基因芯片发展而来的DNA测序技术。
2.一代测序为合成终止测序,而二代测序开创性的引入了可逆终止末端,从而实现边合成边测序。
3.二代测序在DNA复制过程中通过捕捉新添加的碱基所携带的特殊标记(一般为荧光分子标记)来确定DNA的序列。
4.现有的技术平台主要包括Roche的454 FLX、Illumina的Miseq/Hiseq等。
5.由于在二代测序中,单个DNA分子必须扩增成由相同DNA组成的基因簇,然后进行同步复制,来增强荧光信号强度从而读出DNA序列;而随着读长增长,基因簇复制的协同性降低,导致碱基测序质量下降,目前二代最长的读长是miseq的600bp。
6.二代测序适合扩增子测序(例如16S、18S、ITS的可变区),而基因组、宏基因组DNA则需要使用鸟枪法打断成小片段,测序完毕后再使用生物信息学方法进行拼接。
鸟枪法:将大分子的目标DNA随机地处理成大小不同的小片段进行测序,并在后续的生物信息学分析中将这些短序列组装成目标DNA的技术方法。
传统方法:使用限制性内切酶对目标DNA上的限制性内切酶识别位点进行切割,从而形成小片段。
常用方法:使用机械法(例如超声波DNA破碎)使大分子DNA形成在一定长度范围内分布的短序列片段。
二、代测序的背景和特点
1.2005年,罗氏推出了第一款二代测序仪罗氏454,生命科学开始进入高通量测序时代。
2.随着Illumina系列测序平台的推出,极大降低了二代测序的价格,推动了高通量测序在生命科学各个研究领域的普及。
3.特点:通量高、读长短
三、NGS实验步骤
1.核酸提取与检测
2.文库构建与文库检测
3.上机测序
原理:
从细胞中分离得到的DNA是与蛋白质结合的DNA,其中还含有大量RNA,即核糖核蛋白。利用DNA不溶于0.14mol/L的NaCl溶液而RNA能溶于0.14mol/L的NaCl溶液这一性质可以将DNA核蛋白和RNA核蛋白从样品破碎细胞液中分开。分离得到核蛋白后,还需进一步将蛋白等杂质除去。
去除蛋白的方法有3种:
①用含辛醇或异戊醇的氯仿振荡核蛋白溶液,使其乳化,然后离心除去变性蛋白质。用这种方法处理时,蛋白质停留在水相和氯仿相中间,而DNA则溶于上层水相,用两倍体积95%乙醇溶液可将DNA钠盐沉淀出来。
②用十二烷基硫酸钠(SDS)等去污剂使蛋白质变性,从而使其与核酸分离,也可从材料中直接提取出DNA。
③用苯酚处理,然后离心分层,一样可以将DNA+与蛋白质分离开来。这时DNA溶于上层水相,蛋白变性后则停留在酚层内,吸出上层水相,加入两倍体积的95%乙醇即可得到白色纤维状DNA沉淀。反复使用上述方法多次处理DNA核蛋白溶液,就能将蛋白等杂质较彻底地除去,得到较纯的DNA制品。
磁珠吸附法
过柱收集法
DNA提取步骤
✱细胞裂解
✱去除杂质
✱回收DNA
✱清洗溶解DNA
2.文库构建与文库检测
NGS文库构建:DNA片段加接头修饰
的过程。
以试剂盒NEBNext®Ultra™II DNA Library Prep Kit for Illumina®为例
具体步骤:
①末端修饰:
1.使用Tap聚合酶补齐不平的末端
2.并在两个末端添加突出的碱基A,从而产生粘性末端(若使用Tap酶扩增,则无需末端修饰)
3.产生粘性末端的片段可以添加接头(Adaptor)
②添加接头:
1.经过末端修饰后的PCR片段末端具有突出的A尾,而接头具有突出的T尾,可以使用连接酶将接头添加到DNA片段两端。
2.NEB的接头为特殊的碱基U链接的环状结构(可以增强稳定性),因此连接接头后,还需要将碱基U删除从而形成"Y"型接头。
3.上一步添加的接头主要是为了后续PCR中作为引物扩增继续添加文库index和与测序平台互补的寡核苷酸序列(此外还作为测序引物Rd1 SP/Rd2 SP).
4.之所以为"Y"型开叉结构,是因为每一端接头是两条不互补的序列(每一端都是Rd1 SP与Rd2 SP交错),连接酶没有选择性,每个接头都是只靠突出来的T与DNA链接,"Y"接头保证了每条单序列均为不同的测序引物,从而在后续PCR中可以连接不同的管核苷酸序列(P5/P7)。
③磁珠纯化:
添加接头后的文库体系中含有聚合酶、连接酶等各种酶以及辅助物质,接头的添加也是过量的,而且由于末端的不稳定性,容易形成自连片段,鸟枪法打断的片段中也可能有大片段存在,所以需要特殊磁珠(AMPure XP Beads)纯化来去除大片段以及各种杂志,从而获得成功添加接头的文库片段。
1.原理:磁珠可以通过氢键等作用力来吸附DNA片段,磁珠本身不具有片段大小选择的能力,但其储存的buffer里面还有20%的PEG 8000,PEG浓度越大则可以吸附的DNA片段越小。
2.注意事项:磁珠纯化的时候要根据文库片段不同严格控制磁珠添加量(实际上就是PEG添加量)来实现片段选择。
④PCR扩增:
1.添加了接头的DNA片段,可以使用与接头互补的引物来扩增。
2.片段还需要添加用于区分不同文库的特异性index,以及与测序仪芯片互补的两种寡核苷酸序列(P5/P7)。
⑤第二次磁珠纯化:
1.PCR后需要将产物DNA片段与聚合酶等杂质分离,因此再次进行磁珠纯化。
2.之后进行质量检测,包括DNA浓度检测、琼脂糖凝胶电泳和片段长度检测,完成建库。
总体流程
①
②
五、NGS上机测序
(一)成簇
成簇是DNA片段被扩增的过程,该过程在流动池 (Flowcell) 中完成。它是一片带有8条通道(lanes)的玻璃载玻,每个通道内表面附有两种DNA引物。
引物会与样品中的DNA片段的接头序列互补配对,固定在通道表面
通过聚合酶生成杂交片段的互补片段,然后加入NaOH碱溶液后,双链分子变性,原始模板链(左边的链)被流动池中的液体洗去
加入中性液体用于中和碱溶液,剩下的单链拷贝链另一端的接头就会与通道表面的引物结合,形成单链桥。
同样的,在聚合酶参与下,生成互补链,最终形成双链桥
通过变性,DNA分子线性化,变为两个单链拷贝
它们又分别与自己配对的引物结合
重复这个循环,同时形成数百万的簇。所有的DNA片段都会被克隆扩增。
桥式扩增后,反向链会被切断洗去,仅留下正向链。为防止特异性结合重新形成单链桥,3'端被封锁
(二)测序
在Flowcell中加入荧光标记的dNTP和酶,由引物起始开始合成子链。但是dNTP存在 3'端叠氮基会阻碍子链延伸,这使得每个循环只能测得一个碱基。合成完一个碱基后, Flowcell 通入液体洗掉多余的dNTP和酶,使用显微镜的激光扫描特征荧光信号。
荧光发射波长与信号强度一起决定了碱基的读出,所有的DNA片段的一个碱基会被同时读取。在大规模并行的过程中,机器读取的图像类似下面这样
加入化学试剂将叠氮基团与荧光基团切除,然后 Flowcell 再通入荧光标记的dNTP和酶,由引物起始开始合成一个碱基。不断重复这个过程,完成第一次读取。
首先要将模板链3'去保护,模板折叠,index片段引入
在聚合酶参与下形成双链桥
然后变性,恢复为单链。注意,这次是将正向链切除并洗去,只留下反向链
反向链以测序引物为起始,与正向链类似,经过多个循环后完成读取。
测序完成后会产生数百万个 reads,基于在样品准备时构建的 index 分类来自不同样本的序列。对于每个样品来说,具有相似延伸的碱基被聚在一起。正向和反向read配对生成连续序列。这些序列通过与参考基因组匹配后,实现完整序列的构建。
谢 谢