【NGS 次世代基因體資料科學】 基礎教學 02 生資學術研究流程中常見的程式彙整

這裡按照常見得上下游分析階段,以及會使用到的工具整理如下,可以比較快速上手整個分析方法。
FASTQ 下載
- fastq-dump(SRA Tool Kit) : https://github.com/ncbi/sra-tools/wiki/02.-Installing-SRA-Toolkit
- fasterq-dump : https://github.com/ncbi/sra-tools/wiki/HowTo:-fasterq-dump
- parallel-fastq-dump : https://github.com/rvalieris/parallel-fastq-dump
FASTQ 品質控制以及 Trimming
- fastqc :
- fastp : https://github.com/OpenGene/fastp
- Trimmomatic : https://github.com/usadellab/Trimmomatic
序列比對 Aligners
- DNA : Bowtie2 , Bowtie2 , BWA (recommend : BWA-MEM)
- RNA : STAR , TopHat , TopHat2
SAM/BAM 處理工具
- samtools
重複標記與移除 Remove Duplicate
- MarkDuplicates (Picard)
- sambamba
- samtools
峰值鑑定 Peak Calling
- MACS2
- findPeaks(HOMER)
定量工具 Quantification
- featureCounts (subread)
- Cufflinks
- htseq-count(HTSeq)
- StringTie
- RSEM
- kallisto(alignment-free)
差異表達分析與校正 Differential Expression Analysis
- DESeq2
- EdgeR
- Limma
差異峰值分析 Peak Difference
- DiffBind
變異鑑定 Mutation Calling
- Mutect2
- VarScan
- Deepvariant
拷貝數變異鑑定 Copy number variation Calling
- CNVseq
基序分析 Motif Analysis
- HOMER
- MEME
峰值註釋 Peak Annotation
- annotatePeaks (HOMER)
- ChIPseeker
基因集富集分析Gene Set Enrichment Analysis
- GSEA and MSigDB
- clusterprofiler
基因本體分析(基因功能分析) Gene Ontology analysis
- Go.db
是一個對 “下一個世代” 的醫療科技充滿熱血的 Bioinformatican