Bioinformatics/Metagenomics

[QIIME2] QIIME과 관련된 Data resources

2021. 3. 31. 10:59

QIIME과 관련된 data resources가 QIIME doc에 소개되어있다. 그 종류에는 다음이 있다.

 

Taxonomy classifiers for use with q2-feature-classifier

Alignment method가 아니라 machine learning based method로 taxnomic assignment를 하기 위해서는 classifier가 필요하다. 물론 classifier를 직접 만들 수 있지만 (실제로는 직접 만드는 것이 더 좋다, 아래 link 참조), 이미 만들어 놓은 classifier도 QIIME에서 제공한다.

  • Naive Bayes classifier (Silva)
  • Naive Bayes classifier (Greengenes)

Silva 99% OTU, Greengenes 99% OTU 등은 99%를 기준으로 중복되는 sequence를 제거(그래도 cultivated species로부터 유래한 것은 남겨둠)해서 representative만 남겨둔 non-redundant version을 의미한다.

 

Greengenes 85% OTU의 경우 같은 taxonomy를 가진 sequence가 존재하기도 한다. 예를 들어 "k__Bacteria; p__Elusimicrobia; c__; o__; f__; g__; s__"에 해당하는 sequence가 여럿 있을 수 있다. 한편, EzBioCloud에서는 이들을 임의의 이름으로 species 단위까지 구분하여 표시하고 있다.

 

Silva 99% OTU에서는 "Bacteria;Firmicutes;Clostridia;Oscillospirales;Oscillospiraceae;uncultured;gut metagenome"의 taxnomy를 가진 것도 존재

 

Marker gene reference databases

QIIME에서 사용할 수 있도록 fommating이 되어있다.

  • Greengenes (16S rRNA)
  • Silva (16S/18S rRNA)
  • UNITE (fungal ITS)

 

Microbiome bioinformatics benchmarking

프로그램 성능을 테스트하기 위한 public mock community data를 다운받을 수 있다. Mock communites란, isolated microorganisms를 특정 abundance 비율로 pooling해서 만들어진 인공적인 communites를 말한다. Abundance 비율을 우리가 알고 있기 때문에 성능 테스트에 사용될 수 있다.

 

Public microbiome data

  • Qiita: public microbiome datasets을 둘러보고, meta-analysis를 수행할 수 있다.

 

SEPP reference databases

q2-fragment-insertion에 사용할 수 있는 database가 존재한다.

 

Reference

 

728x90
반응형