注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云地日志

立身娉婷北高峰,花事纷纭心事秾。飓风和雨吹折后,病枝弱叶一扫空。

 
 
 

日志

 
 

测序经验谈之:碱基不平衡  

2014-08-28 23:16:52|  分类: 二代测序 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
碱基复杂度与碱基不平衡 - 陈云地 - 现代汉语的音韵美感寻找
 
碱基平衡度、碱基复杂度与碱基多样性三个词,是一个意思,是从不同的角度描述同一个现象,可以把它们看成是同义词。当一个DNA片段的碱基组成多样化,其复杂度就高,平衡性就好。多样性低(low diversity)与碱基不平衡是一个意思,指的是碱基组成单调,种类少,所以不平衡。

碱基复杂度本来没有多么重要,甚至无关紧要。从前,除了设计PCR引物的时候要考虑GC含量高低 (GC-rich) 以外,几乎没人关注这个问题,没人会认为这是一个问题。可是现在,随着Illumina二代测序技术风靡全球,这个原本不起眼的概念意外地变得重要起来。

一、概念

细究起来,碱基复杂度与碱基平衡度还是存在细微差别的。对于一个DNA片段来说,它所包含的碱基种类越多,则碱基复杂度越高;如果各种碱基的百分含量越接近一致,甚至达到25%,则碱基平衡度越好。

假设一个DNA片段,它的全部碱基都是A,AAAAAAAAAAAAA……AAAAAAAAAAA,显然其碱基组成是极度不平衡的。
DNA的碱基只有4种:A、G、C、T,所以碱基最平衡的情况就是:%A=%G=%C=%T=25%。比如这样的DNA片段:AGCTAGCTAGCTAGCTAGCT……AGCTAGCTAGCT。当然,碱基的排列顺序可以打乱,不需要这么有规律,只要碱基总数相等即可。

以上是从横的方面讲这个问题,是沿着一条DNA链,从5' -> 3'。

对于Illumina二代测序,横向步重要,重要的是纵的方面。也就是说,如果我们让12个DNA片段整整齐齐地排列起来,它们第一个位置的12个碱基如果都是A,则复杂度太低,严重不平衡;如果A和G各有6个,虽然平衡了,但是复杂度还是不够;如果A、G、C、T各有3个,碱基复杂度达到最高值,碱基平衡性也最好;如果A3个、G4个、C4个、T1个,虽然碱基组成是很复杂的,但是严重不平衡,T太少。这才是我们需要讨论的碱基平衡不平衡问题。

二、危害

Illumina的二代测序仪只有两个激光管,分别为红激光和绿激光。两种激光要检测4种碱基,显然不够用,因此Illumina又使用了2张滤色片。两两组合,正好形成4种不同的检测波长,分别用于收集A、C、G、T4种碱基的荧光信号。当然,碱基本身并不发射荧光,是在碱基上标记了4种不同的荧光基团。
在测序过程中,仪器分别在这4种波长范围内收集信号、拍照 ;然后经过软件处理,把这4张照片叠加成一张;比较、识别每一个cluster的最强信号,即可认定碱基的种类。在图片处理的过程中,需要进行cluster定位及其他运算。
如果DNA文库(=DNA片段集)在某个位置缺少一种碱基,或者某种碱基的占比非常低,那么测序拍照收集信号时,该位置、该波长的照片就是全黑的,没有信号,或者cluster稀稀拉拉的,信号微弱。软件只凭3张图,无法完成4张图的叠加。图片合成以及cluster定位无法完成,就不能准确地识别该碱基,导致数据质量和数据产量下降。

需要特别注意碱基复杂度的二代测序应用有:
    PCR产物测序,特别是用于鉴定细菌、真菌以及其他物种的16S rRNA PCR产物测序;
    小RNA测序;
    甲基化测序;
    插入片段短于测序读长;
    接头二聚体含量比较高的文库 。
另外,在多样本混合测序的时候,要注意Barcode组合的碱基平衡度。

三、增加碱基复杂度的方法
文库:
1、把不同的文库混合在一起,自然达到碱基平衡。
2、如果没有其他文库,那么掺入人基因组DNA文库、人外显子组文库或者PhiX标准品。这些都是已知碱基平衡的。

引物:
3、对于PCR产物来说,只要引物长度不同,就能自然错开,增加碱基复杂度。
4、采用多对序列不同的引物来完成扩增,然后将产物混合在一起。
5、使用随机引物。

Barcodes:
6、仔细挑选barcode组合,确保每个位置都有3-4种碱基、且碱基分布均衡。
  评论这张
 
阅读(556)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017