Bioinformatics/Metagenomics

[QIIME2] 숙련된 연구자들을 위한 QIIME2 Overview

2021. 3. 2. 11:56

해당 내용은 QIIME 2 Tutorial을 바탕으로 작성된 글로, Reference의 URL에서 원본 내용을 확인할 수 있습니다.

Pro-tips

  1. QIIME2 artifacts는 zip files이기 때문에 export하거나 unzip -k file.qza로 무엇이 들었는지 확인 가능.
  2. QIIME2를 command line에서 돌리면 느리다 (압축 과정이 들어있기 때문): Python API를 사용하면 빠르게 분석 가능.

 

데이터 분석 과정

1. Raw sequence (FASTQ) importing (qiime tools import)

 

2. Demultiplexing (q2-dmux, cutadapt)

  • q2-dmux: barcodes가 이미 sequence에서 제거되어 분리된 파일에 있는 경우 사용
  • cutadapt: barcodes가 아직 sequence에 있는 경우 사용
  • Barcodes가 forward reads에만 있을 때 사용 가능. dual-barcoded paired-end의 경우에는 bcl2fastq 사용

 

3. Merging reads (q2-vsearch)

  • deblur나 OTU clustering method: Merging 필수
  • DADA2: Merging X

 

4. Non-biological sequence 제거 (q2-cutadapt, dada2)

  • Non-biological sequence: primers, sequencing adapters, PCR spacers, etc

 

5. Grouping similar sequences: Denosing과 clustering 방법 중 선택 가능.

  • FeatureData[Sequence]: Representative sequences의 리스트
  • FeatureTable[Frequency]: 각 reads가 얼마나 들어있는지에 대한 정보

 

    5.1. Denoising (data2, deblur)

  • DADA2: paired-end, single-end, pyro (for ion torrent) methods 포함
  • deblur: denoise-16S (GreenGenes DB와 비교하여 16S rDNA로 예측되는 것만 사용), denoise-other (그런 필터 X)

 

    5.2. OTU clustering

  • Clustering 전 데이터는: 1) Merging, 2) Non-biological sequence 제거, 3) 같은 길이로 trimming (cutadapt), 4) low-quality 제거(quality-filter)되어야 함.
  • Dereplicating (q2-vsearch)
  • De novo clustering (q2-vsearch, q2-dbotu): similarity-based  VS  distribution-based
  • Closed reference clustering (q2-vsearch)

 

5. Assigning taxonomy (feature-classifier)

  • classify-consensus-blast: BLAST+ local alignment
  • classify-consensus-vsearch: VSEARCH global alignment
  • classify-sklearn: machine learning 기반

 

6. Analyze data

  • 데이터 시각화: taxa barplot visualizer, emperor (PCoA plot)
  • 계통수: phylogeny
  • Alpha diversity: diversity
  • Beta diversity: diversity
  • 샘플 간 차이 확인: diversity (beta-group-significance), composition, gneiss
  • 머신러닝 classfier 및 predictor: q2-sample-classifier

 

7. Data exporting (qiime tools export)

 

 

Reference

 

 

728x90
반응형