3.7.2 群体联合分型

gtx genotype_gvcfs 支持对单个输入进行联合分型,输入可以是GenomisDB工作目录,也可以是已经合并的单样本/多样本GVCF文件。

输入

  • 单一输入,支持如下类型:

    • 单样本GVCF文件

    • 合并的多样本GVCF文件

    • GenomicsDB工作目录,由 gtx gi 工具创建。

  • 参考基因组FASTA文件

重要

  • 仅支持由 gtx vcgtx wgs 生成的GVCF文件作为输入。

  • 单个命令行不能接受多个GVCF作为输入。

输出

  • 多样本联合分型结果VCF文件

示例命令

# input.g.vcf can be a single-sample GVCF or a multi-sample GVCF
gtx genotype_gvcfs \
   -r hg38.fa \
   -v input.g.vcf.gz \
   -o output.vcf.gz
# input is a GenomicsDB workspace
gtx genotype_gvcfs \
   -r hg38.fa \
   -v gendb://my_database \
   -o output.vcf.gz
参数列表

-h, --help

打印此帮助信息

-r, --reference

参考基因组FASTA文件

-v, --variant

包含变异的VCF文件

-o, --output

存储突变结果的文件路径

-t, --threads

线程数,默认为CPU数目

-L, --intervals

基因组区间,支持BED, interval_list格式文件,也可以输入字符串格式如’chr:start-end’, 可指定多次

--tmp-dir

临时文件输出目录

--keep-combined-raw-annotations

指定该选项将保留原始的注释信息,如AS_SB_TABLE, 适用于等位基因特有的注释信息

--max-genotype-count

单个位点允许的最大分型数目,默认为1024

--include-non-variant-sites

输出包含基因组非突变位点