Bioinformatics/Metagenomics

[QIIME2] Atacama soil microbiome 튜토리얼

2021. 3. 4. 15:00

해당 내용은 QIIME 2 Tutorial을 바탕으로 작성된 글로, Reference의 URL에서 원본 내용을 확인할 수 있습니다.

데이터 정보

아타카마 사막(칠레)의 두 곳에서 구덩이를 파고 각각 세 가지의 깊이에서 퍼온 흙 샘플 (Paired-end read, Multiplexed)

  • sample_metadata.tsv
  • sequences/forward.fastq.gz
  • sequences/reverse.fastq.gz
  • sequences/barcodes.fastq.gz

 

데이터 분석

'''
1. Importing
'''
qiime tools import \
   --type EMPPairedEndSequences \
   --input-path sequences \
   --output-path sequences.qza # EMPPairedEndSequences
   
'''
2. Demultiplexing
'''
qiime demux emp-paired \
  --m-barcodes-file sample-metadata.tsv \
  --m-barcodes-column barcode-sequence \
  --p-rev-comp-mapping-barcodes \ # the barcode reads are the reverse complement of those included in the metadata
  --i-seqs sequences.qza \
  --o-per-sample-sequences demux-full.qza \
  --o-error-correction-details demux-details.qza
  
'''
3. Denoising (DADA2)
'''
qiime dada2 denoise-paired \
  --i-demultiplexed-seqs demux.qza \
  --p-trim-left-f 13 \
  --p-trim-left-r 13 \
  --p-trunc-len-f 150 \
  --p-trunc-len-r 150 \
  --o-table table.qza \
  --o-representative-sequences rep-seqs.qza \
  --o-denoising-stats denoising-stats.qza
  
# Check Denoising
qiime feature-table summarize \
  --i-table table.qza \
  --o-visualization table.qzv \
  --m-sample-metadata-file sample-metadata.tsv

qiime feature-table tabulate-seqs \
  --i-data rep-seqs.qza \
  --o-visualization rep-seqs.qzv

qiime metadata tabulate \
  --m-input-file denoising-stats.qza \
  --o-visualization denoising-stats.qzv

 

 

참고

  • Subsampling the data: 샘플에서 fraction만큼의 시퀀스만 남긴다.
qiime demux subsample-paired \
  --i-sequences demux-full.qza \
  --p-fraction 0.3 \
  --o-subsampled-sequences demux-subsample.qza

qiime demux summarize \
  --i-data demux-subsample.qza \
  --o-visualization demux-subsample.qzv
  • Filtering the data: 100개 이하의 sequences만 가진 샘플은 filtering하고자 할 때 아래와 같이 할 수 있다.
qiime tools export \
  --input-path demux-subsample.qzv \
  --output-path ./demux-subsample/

qiime demux filter-samples \
  --i-demux demux-subsample.qza \
  --m-metadata-file ./demux-subsample/per-sample-fastq-counts.tsv \
  --p-where 'CAST([forward sequence count] AS INT) > 100' \
  --o-filtered-demux demux.qza

 

Reference

 

 

728x90
반응형