3.4 碱基质量值校正

碱基质量在变异位点鉴定过程中对于衡量变异等位基因的证据支持十分重要,因此,校正数据中可能存在的任何系统误差对于准确鉴定变异位点至关重要。这些系统误差可能由建库测序等实验环节引入,也可能由于测序芯片和测序仪本身的缺陷导致。gtx bqsr 首先从数据中学习影响碱基质量的协变量因子并对其进行统计建模,再将所得模型应用于整个数据集来达到校正碱基质量系统偏差的目的。

输入

  • 输入BAM文件

  • 参考基因组FASTA文件

  • 已知位点VCF文件(可选)

输出

  • 输出BAM文件

  • 碱基质量校正表文件

示例命令

# create recalibration table from input BAM
gtx bqsr \
  -i in.bam \
  -r hg19.fa \
  --bqsr in.bam.recal.grp \
  --known-sites gatk-bundle/dbsnp_138.hg19.vcf
# apply base recalibration model to input BAM using existing recalibration table
gtx bqsr \
  -i in.bam \
  --bqsr in.bam.recal.grp \
  -o out.bqsr.bam \
# combine two stages
gtx bqsr \
-i in.bam \
-o out.bqsr.bam \
-r hg19.fa \
--bqsr in.bam.recal.grp \
--known-sites gatk-bundle/dbsnp_138.hg19.vcf
参数列表

-r, --reference

参考基因组FASTA文件

-i, --input

输入排序标重后BAM文件

-o, --output

输出碱基质量校正后BAM文件

--bqsr

校正表文件

--known-sites

已知多态性位点数据库文件,VCF格式

-h, --help

打印帮助信息