해당 내용은 QIIME 2 Tutorial을 바탕으로 작성된 글로, Reference의 URL에서 원본 내용을 확인할 수 있습니다.
Pro-tips
- QIIME2 artifacts는 zip files이기 때문에 export하거나 unzip -k file.qza로 무엇이 들었는지 확인 가능.
- QIIME2를 command line에서 돌리면 느리다 (압축 과정이 들어있기 때문): Python API를 사용하면 빠르게 분석 가능.
데이터 분석 과정
1. Raw sequence (FASTQ) importing (qiime tools import)
2. Demultiplexing (q2-dmux, cutadapt)
- q2-dmux: barcodes가 이미 sequence에서 제거되어 분리된 파일에 있는 경우 사용
- cutadapt: barcodes가 아직 sequence에 있는 경우 사용
- Barcodes가 forward reads에만 있을 때 사용 가능. dual-barcoded paired-end의 경우에는 bcl2fastq 사용
3. Merging reads (q2-vsearch)
- deblur나 OTU clustering method: Merging 필수
- DADA2: Merging X
4. Non-biological sequence 제거 (q2-cutadapt, dada2)
- Non-biological sequence: primers, sequencing adapters, PCR spacers, etc
5. Grouping similar sequences: Denosing과 clustering 방법 중 선택 가능.
- FeatureData[Sequence]: Representative sequences의 리스트
- FeatureTable[Frequency]: 각 reads가 얼마나 들어있는지에 대한 정보
5.1. Denoising (data2, deblur)
- DADA2: paired-end, single-end, pyro (for ion torrent) methods 포함
- deblur: denoise-16S (GreenGenes DB와 비교하여 16S rDNA로 예측되는 것만 사용), denoise-other (그런 필터 X)
5.2. OTU clustering
- Clustering 전 데이터는: 1) Merging, 2) Non-biological sequence 제거, 3) 같은 길이로 trimming (cutadapt), 4) low-quality 제거(quality-filter)되어야 함.
- Dereplicating (q2-vsearch)
- De novo clustering (q2-vsearch, q2-dbotu): similarity-based VS distribution-based
- Closed reference clustering (q2-vsearch)
5. Assigning taxonomy (feature-classifier)
- classify-consensus-blast: BLAST+ local alignment
- classify-consensus-vsearch: VSEARCH global alignment
- classify-sklearn: machine learning 기반
6. Analyze data
- 데이터 시각화: taxa barplot visualizer, emperor (PCoA plot)
- 계통수: phylogeny
- Alpha diversity: diversity
- Beta diversity: diversity
- 샘플 간 차이 확인: diversity (beta-group-significance), composition, gneiss
- 머신러닝 classfier 및 predictor: q2-sample-classifier
7. Data exporting (qiime tools export)
Reference
728x90
반응형
'Bioinformatics > Metagenomics' 카테고리의 다른 글
[Diversity] 다양성 지표 (Alpha diversity, Beta diversity) (0) | 2021.03.03 |
---|---|
[QIIME2] Moving Pictures 튜토리얼 (QIIME 분석에서 가장 기본이 되는 내용) (0) | 2021.03.02 |
[ASV] Amplicon Sequence Variant (ASV)의 특징과 Operational Taxonomic Unit (OTU)와의 차이점 (1) | 2021.02.22 |
[QIIME2] QIIME2의 workflow 설명 (일반적인 Amplicon data 분석 과정) (0) | 2021.02.18 |
[QIIME2] QIIME2의 핵심 개념 소개 (0) | 2021.02.18 |