注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云地日志

立身娉婷北高峰,花事纷纭心事秾。飓风和雨吹折后,病枝弱叶一扫空。

 
 
 

日志

 
 

测序经验谈之:二代测序原理  

2011-06-18 23:22:42|  分类: 二代测序 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

        二代测序也称大规模平行测序。主要平台有3家:Illumina的HiSeq、MiSeq以及早期的GA;Roche的454;Life Technologies (即ABI,现ThermoFisher)的SOLiD、Ion Torrent和Ion Proton。如今Roche已经停产。


        简单归纳,3家的原理如下:

Roche 454 FLX:Pyrosequencing(焦磷酸测序),检测焦磷酸转换成的荧光信号,emulsion PCR;

Illumina: Sequencing-by-synthesis (边合成边测序)with reversible terminators, bridge PCR;

ABI SOLiD: Sequencing by ligation(边连接边测序), emulsion PCR;

ABI Ion Torrent: Pyrosequencing(焦磷酸测序), 检测质子电位(pH值),emulsion PCR。


        下面以Illumina的技术路线为代表,稍作说明。

DNA测序原理:一代和二代 - Garification - 云地小院子

        Illumina技术是所有二代测序技术路线中最简便的,直奔目的,不绕弯子。因为简单直接,所以稳定可靠,重复性强,数据质量高,错误率低。大量已发表的论文采用此技术,是有其原因的。

        整个测序分4步:文库制备,簇生成,测序,数据分析。

 

1  文库制备 Library Preparation

        文库制备的具体流程因样本种类和测序目的的不同而不同,比如基因组DNA,转录组(mRNA),microRNA, CHiP-Seq,外显子捕获测序等等,但是大同小异,基本过程是把长链DNA随机打断成短片段,两端接上通用引物,再经过12循环左右的PCR把文库放大。

        以基因组DNA为例,文库制备详细流程如下:

        模板提取:按常规进行DNA的提取、纯化、定量。DNA模板越完整越好;用量不多,只需要0.1-5 ug就足以进行二代测序。

1.1  片段化

        运用高压气体的雾化作用、超声波的气穴作用、超声波、金属离子、酶等手段或设备将DNA打断,SR测序的模板长约300碱基,PE测序的模板长约500碱基,MP测序的模板长约1k-10k碱基。凝胶电泳切下所需长度的DNA片段。

1.2  末端修补

        使用2种酶分别把DNA片段的两端补平;磷酸化;3‘端挂上一个A。

1.3  加接头

        接头的3’端有一个突出的T;它们通过类似T-A克隆的方式连接起来。不同应用,接头的序列不一样,所以不能混用。

1.4  割胶纯化

        留下两端连接完整的产物,去掉残缺不全的。

1.5  PCR富集

        进行10-12个循环的PCR,使产物富集。

1.6  文库质控

        PCR完成后可以进行一次凝胶电泳,或者使用2100,检测文库的质量和浓度。

 

2  簇生成 Cluster Generation

        簇生成在flowcell上进行,要用到专用的仪器cluster station或者cBot。主要步骤有模板杂交,桥式PCR,线性化,末端封闭,测序引物杂交。

2.1  模板杂交

        DNA文库经NaOH变性,稀释调整浓度到6pM左右;引入流动池,随机地与分布在FC通道内壁的接头杂交;通过互补链合成而固定到FC上,原来的模板单链则在碱变性后被冲去。

2.2  桥式扩增

        固定在FC上的DNA单链的另一端与FC内壁的相应接头杂交,形成桥状结构,在高保真DNA聚合酶的作用下,合成互补链。这一过程重复20次左右,每条单链都被放大到1000-6000条,形成一簇。上百万的簇随机分布在FC的内壁上。

2.3  线性化

        此时的簇由双链构成,为了测序,需要把它们切割成单链。FC上固定的接头预先设有化学试剂或者酶的切割位点,因而可以定向切断一条单链,通过碱变性、缓冲液冲洗而去除。

2.4  末端封闭

        在所有的游离末端上加一个ddNTP,防止测序时的随机延伸。

2.5  引物杂交

        引入测序引物,杂交到通用引物的结合位点上。至此FC即已准备就绪,可以拿到测序仪上进行测序。

 

3  边合成边测序 Sequencing-by-Synthesis (SBS)

        SBS在GA或者HiSeq等测序仪上进行。主要步骤有碱基延伸,荧光激发和拍照,剪切等。这3个步骤重复进行,想测定多少个碱基,就重复多少次。通常每次SR实验测定100个碱基,PE实验测定2x100个碱基。

3.1  碱基延伸

        把FC从cBot搬到测序仪上,进行碱基延伸。所用的dNTP带有荧光基团和终止基团两种修饰,因而每次只能延伸1个碱基。去除未结合的带荧光标记的所有核苷酸。

3.2  信号采集

        激光激发荧光基团产生信号,相机拍摄照片。拍照过程相当耗时,一次循环所产生的信号需要40分钟左右才能拍照收集完毕。

3.3  剪切

        酶剪切去除荧光基团和终止基团后,去除荧光,并且使链末端的碱基回复到可延伸的状态。

重复上面步骤,进行第二个碱基的信号收集。

 

4  数据分析 Data Analysis

        数据分析包括初级分析、次级分析、数据展示3步。初级分析相当于一代测序的终点:碱基识别。

4.1  初级分析

        碱基识别的原理非常简单,简直称不上“原理”这么庄严的词。把照片按时间顺序排列,对每个簇进行坐标定位,然后根据每个簇的颜色变化读取一条序列。序列长度取决于SBS的循环次数。在碱基识别的同时,软件进行碱基质量评估,为每个测得的碱基赋予一个QV分值。

4.2  次级分析

        次级分析包括序列的组装和拼接,SNP以及基因突变的识别,mRNA和micro RNA定量等。

4.3  数据展示

        由于获得的是海量数据,无法靠人眼一一过目,所以需要用软件将分析结果总结归纳成图标和曲线。

        Illumina的最新型号HiSeq X10,一次实验得到1600 G碱基(=1.6 Tb)的数据。600 Gb测序数据经过初级分析,形成fastq文件,大小为600 G比特。

  评论这张
 
阅读(6126)| 评论(1)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017