注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云地日志

立身娉婷北高峰,花事纷纭心事秾。飓风和雨吹折后,病枝弱叶一扫空。

 
 
 

日志

 
 

二代测序常见问题解答:文库投入量与数据产出量的比例  

2015-08-20 17:00:35|  分类: 二代测序 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
二代测序常见问题解答:文库投入量与数据产出量的比例 - 陈云地 - 云地日志
 

文库投入比例与数据产出比例

1、  Illumina二代测序技术在flowcell上形成cluster的过程是完全随机的(最新的HiSeq X10和HiSeq 4000的flowcell是打孔的,cluster的生成是半随机的),不同的样本混合在一起测序,在大尺度上,数据产出量与文库投入量大致成比例,但不是严格正比。即使是质量非常好的文库,样本投入与数据产出之间的比例也存在很多不确定性。

 

文库碱基不平衡与数据产量比例

1、  如果文库的碱基组成不平衡,Illumina软件在利用实际测序数据的前4个循环(基本参数,比如cluster定位坐标、空间定位offset值、光谱校正matrix值等)以及前25个循环(PF, QV)统计分析参数的时候,统计结果不准确,从而会影响本lane测序的所有碱基的准确识别,还会导致部分cluster虽然长在flowcell上,却不能收获测序数据。

2、  碱基平衡是指文库的碱基组成符合两个条件:a、每一个测序循环中,AGCT四种碱基都有;b、这4种碱基的组成比例接近1:1:1:1,也就是各25%。

3、  如果一条lane所测序的混合文库,整体上碱基组成严重不平衡,则数据产出比例完全无法根据文库投入量进行预测。

 

定量PCR的作用

1、  在cluster生成过程中,有一个桥式PCR的步骤。这决定了只有能够进行PCR的文库才能生成cluster,才能被测出序列。

2、  有些情况下,文库中含有部分“不可PCR的模板”,比如FFPE样本中碱基受到损伤、碱基有交联,它们能阻碍PCR的进行;再比如PCR-FREE的文库里包含有部分接头连接不完整的“残疾”文库,像一边有接头一边没有接头的,PCR就做不好。在这些情况下,最后用定量PCR对文库进行定量,定出来的是“可PCR的文库的量”。定量PCR的优点是这一点,并不是大家通常理解的定量PCR比Qubit准确。Qubit也是很准确的定量方法,Qubit的缺点是定量结果里包含了可PCR部分和不可PCR部分。

3、  定量PCR不能解决碱基不平衡问题,因为碱基不平衡的文库仍然能被定量。所以,定量PCR不能改善数据产出比例。

 在这样的情况下,即使实验室尽最大努力把定量做得很准确,把取样的操作也做得很准确,以求数据表现最理想,还是不能保证数据之间的比例。

 

建议

1、  把碱基不平衡的文库与碱基平衡的文库(比如人基因组文库、人外显子文库、Illumina标准品PhiX文库)混合在一起,可以改善“混合文库”的总体碱基平衡度。尽管这种混合仍然不能预测混合文库之间的数据比例,但是,如果平衡的文库足够多,可以提高整条lane的数据量。

2、  对于碱基不平衡的文库,不要期望它们混合在一起后,数据比例还能不变形不走样。不平衡的文库不建议单独测序。可以考虑掺入PhiX,掺入的比例视不平衡的严重程度而增加,但是PhiX数据对于客户而言是没有用的,是一种浪费。

  评论这张
 
阅读(1079)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017