全文预览

宏基因组结题报告及结果文件解读

上传者:火锅鸡 |  格式:pptx  |  页数:55 |  大小:6904KB

文档介绍
nData 中测序错误率小于0.01(质量值大于 20)和 0.001(质量值大于 30)的碱基数目的百分比;?Clean_GC(%) 表示 CleanData 中碱基的 GC 含量;Effective(%) 表示有效数据( CleanData )与原始数据( RawData )的百分比。Р一、质控Р一、质控Р|--01.CleanData--readme.pdf ?|-- novototal.QCstat.info.xls?|-- total. dog.NonHostQCstat.info.xls?|-- total.QCstat.info.xls?|-- QC_raw_report/?|--sampleA/?| |-- sampleA_350.fq1.gz?| |-- sampleA_350.fq2.gz?| |-- sampleA_350.nohost.fq1.gz?| |-- sampleA_350.nohost.fq2.gz?| |-- sampleA_350.base.png?| |-- sampleA_350.qual.pngР结果文件解读:Р碱基含量分布Р碱基质量分布РKmer:具有指定长度为K (如K=11)的DNA序列,默认值为55? Kmer个数与Kmer长度公式:N=L-K+1 ,? 假设read长(L)为31bp,K=11,一共可以产生31-11+1=21个Kmer;РOverlap:当两序列A、B的边缘区域满足设定的序列相似性,则A和B序列存在 Overlap关系。РAРBРkmerР二、组装Р基本概念РContig:通过序列的Overlap关系搭建起来的非冗余序列集;? РScaffold:通过使用具有paired-end关系的reads对Contig序列集进行连接后得到的序列集;有N? Gap:序列中未确定的区域,通常用N或n表示。Р二、组装

收藏

分享

举报
下载此文档