运行

运行示例

示例1:基本用法

为分析设置必要的配置文件,包括样本数据的路径、参考基因组路径等。使用以下命令运行 SeekArcTools:

seekarctools_py arc run \
    --rnafq1 /path/to/demo/demo_GE_S1_L001_R1_001.fastq.gz \
    --rnafq2 /path/to/demo/demo_GE_S1_L001_R2_001.fastq.gz \
    --atacfq1 /path/to/demo/demo_arc_S2_L002_R1_001.fastq.gz \
    --atacfq2 /path/to/demo/demo_arc_S2_L002_R2_001.fastq.gz \
    --samplename demo \
    --outdir /path/to/outdir \
    --refpath /path/to/reference/GRCh38 \
    --include-introns \
    --core 16

示例2:设置阈值重新进行 call peaks 或 call cell

若觉得默认参数下判定出的 peaks 或 cells 不符合需求,可调整参数跳过比对等之前的步骤,重新运行以节省时间

seekarctools_py arc retry \
    --samplename demo \
    --outdir /path/to/outdir \
    --refpath /path/to/reference/GRCh38 \
    --core 16 \
    --qvalue 0.01 \
    --snapshift 0 \
    --extsize 200 \
    --min_len 200 \
    --min_atac_count 1000 \
    --min_gex_count 500
  • 注:需注意保持之前运行的文件没有删除或移动。--outdir为seekarctools第一次分析后的目录路径。--min_atac_count需和--min_gex_count一起使用,否则不生效。

参数说明

参数

参数说明

–rnafq1

表达文库 R1 fastq数据路径。

–rnafq2

表达文库 R2 fastq数据路径。

–atacfq1

ATAC文库 R1 fastq数据路径。

–atacfq2

ATAC文库 R2 fastq数据路径。

–samplename

样本名称。

–outdir

结果输出目录。默认值:./。

–skip_misB

barcode不允许碱基错配,默认允许一个碱基错配。

–skip_misL

linker不允许碱基错配,默认允许一个碱基错配。

–skip_multi

舍弃能纠错为多个白名单barocde的reads,默认纠错为比例最高的barcode。

–skip_len

在适配器筛选后跳过筛选短读取,将使用短读取。

–core

分析使用的线程数。

–include-introns

不启用时,只会选择exon reads⽤于定量;启用时,intron reads也会⽤于定量。

–refpath

参考基因组路径。

–star_path

外部 STAR 软件路径。如果参考基因组中的索引由其他STAR构建,请指定该路径。

–qvalue

峰值检测的最小FDR(q值)截止值。默认值:0.05。

–nolambda

若启用则 MACS3 将使用背景lambda作为本地lambda。这意味着macs3不会考虑峰值候选区域的局部偏差。

–snapshift

MACS3峰值检测的移动幅度。默认值:0。

–extsize

MACS3峰值检测的拓展幅度。默认值:400。

–min_len

峰的最小长度。如果无,则设置为“extsize”。默认值:400。

–broad

若启用则进行广泛的峰值调用,以UCSC gappedPeak格式生成结果,该格式封装了峰值的嵌套结构。

–broad_cutoff

广泛的峰值调用的阈值。默认值:0.1。

–min_atac_count

定义细胞条形码峰中ATAC转置事件的最小数量(ATAC计数)。

–min_gex_count

定义细胞条形码中UMI的最小数量(GEX计数)。

-h,–help

显示参数说明