运行
运行示例
示例1:基本用法
为分析设置必要的配置文件,包括样本数据的路径、参考基因组路径等。使用以下命令运行 SeekArcTools:
seekarctools_py arc run \
--rnafq1 /path/to/demo/demo_GE_S1_L001_R1_001.fastq.gz \
--rnafq2 /path/to/demo/demo_GE_S1_L001_R2_001.fastq.gz \
--atacfq1 /path/to/demo/demo_arc_S2_L002_R1_001.fastq.gz \
--atacfq2 /path/to/demo/demo_arc_S2_L002_R2_001.fastq.gz \
--samplename demo \
--outdir /path/to/outdir \
--refpath /path/to/reference/GRCh38 \
--include-introns \
--core 16
示例2:设置阈值重新进行 call peaks 或 call cell
若觉得默认参数下判定出的 peaks 或 cells 不符合需求,可调整参数跳过比对等之前的步骤,重新运行以节省时间
seekarctools_py arc retry \
--samplename demo \
--outdir /path/to/outdir \
--refpath /path/to/reference/GRCh38 \
--core 16 \
--qvalue 0.01 \
--snapshift 0 \
--extsize 200 \
--min_len 200 \
--min_atac_count 1000 \
--min_gex_count 500
注:需注意保持之前运行的文件没有删除或移动。
--outdir
为seekarctools第一次分析后的目录路径。--min_atac_count
需和--min_gex_count
一起使用,否则不生效。
参数说明
参数 |
参数说明 |
---|---|
–rnafq1 |
表达文库 R1 fastq数据路径。 |
–rnafq2 |
表达文库 R2 fastq数据路径。 |
–atacfq1 |
ATAC文库 R1 fastq数据路径。 |
–atacfq2 |
ATAC文库 R2 fastq数据路径。 |
–samplename |
样本名称。 |
–outdir |
结果输出目录。默认值:./。 |
–skip_misB |
barcode不允许碱基错配,默认允许一个碱基错配。 |
–skip_misL |
linker不允许碱基错配,默认允许一个碱基错配。 |
–skip_multi |
舍弃能纠错为多个白名单barocde的reads,默认纠错为比例最高的barcode。 |
–skip_len |
在适配器筛选后跳过筛选短读取,将使用短读取。 |
–core |
分析使用的线程数。 |
–include-introns |
不启用时,只会选择exon reads⽤于定量;启用时,intron reads也会⽤于定量。 |
–refpath |
参考基因组路径。 |
–star_path |
外部 STAR 软件路径。如果参考基因组中的索引由其他STAR构建,请指定该路径。 |
–qvalue |
峰值检测的最小FDR(q值)截止值。默认值:0.05。 |
–nolambda |
若启用则 MACS3 将使用背景lambda作为本地lambda。这意味着macs3不会考虑峰值候选区域的局部偏差。 |
–snapshift |
MACS3峰值检测的移动幅度。默认值:0。 |
–extsize |
MACS3峰值检测的拓展幅度。默认值:400。 |
–min_len |
峰的最小长度。如果无,则设置为“extsize”。默认值:400。 |
–broad |
若启用则进行广泛的峰值调用,以UCSC gappedPeak格式生成结果,该格式封装了峰值的嵌套结构。 |
–broad_cutoff |
广泛的峰值调用的阈值。默认值:0.1。 |
–min_atac_count |
定义细胞条形码峰中ATAC转置事件的最小数量(ATAC计数)。 |
–min_gex_count |
定义细胞条形码中UMI的最小数量(GEX计数)。 |
-h,–help |
显示参数说明 |