3.8.3.2 计算污染

gtx calc 基于 gtx gps 的结果计算来自样本交叉污染的reads比例,生成的污染统计表将作为 gtx filter 的输入,用于过滤体细胞突变检测结果。

该工具采用了 Cibulskis 等人在 ContEst 中提出的基于纯和突变位点的参考序列reads观测来估计污染的基本思想。但是,ContEst假设基因型为二倍体,不存在拷贝数变异且污染reads之间互相独立。该工具放松了上述假设,因此在存在任意数目样本污染和拷贝数变异的情况下也能工作得很好。此外,该工具同样适用于没有正常对照的情况,即便如此,也可用 gtx gps 工具统计正常对照的pileup信息,并将输出结果作为该工具的输入。

输入

  • 输入 gtx gps 生成的table文件

输出

  • 污染统计结果表格,每个样本一行,格式为:样本名称–制表符–污染比例,文件没有头信息。

示例命令

  • Tumor-only模式

gtx calc \
 -i pileups.table \
 -o contamination.table
  • Tumor-Nomal配对模式

gtx calc \
  -i tumor-pileups.table \
  --matched-normal normal-pileups.table \
  -o contamination.table
参数列表

-h, --help

打印帮助信息并退出

-i

输入table文件

-o

输出table文件

--matched-normal

输入正常样本table文件

--tumor-segmentation

按maf对tumor进行分段后的输出表

--low-coverage-ratio-threshold

最小覆盖度/中位数覆盖度,默认为0.5

--high-coverage-ratio-threshold

最大覆盖度/平均覆盖度,默认为3