QIIME과 관련된 data resources가 QIIME doc에 소개되어있다. 그 종류에는 다음이 있다.
Taxonomy classifiers for use with q2-feature-classifier
Alignment method가 아니라 machine learning based method로 taxnomic assignment를 하기 위해서는 classifier가 필요하다. 물론 classifier를 직접 만들 수 있지만 (실제로는 직접 만드는 것이 더 좋다, 아래 link 참조), 이미 만들어 놓은 classifier도 QIIME에서 제공한다.
- Naive Bayes classifier (Silva)
- Naive Bayes classifier (Greengenes)
Silva 99% OTU, Greengenes 99% OTU 등은 99%를 기준으로 중복되는 sequence를 제거(그래도 cultivated species로부터 유래한 것은 남겨둠)해서 representative만 남겨둔 non-redundant version을 의미한다.
Greengenes 85% OTU의 경우 같은 taxonomy를 가진 sequence가 존재하기도 한다. 예를 들어 "k__Bacteria; p__Elusimicrobia; c__; o__; f__; g__; s__"에 해당하는 sequence가 여럿 있을 수 있다. 한편, EzBioCloud에서는 이들을 임의의 이름으로 species 단위까지 구분하여 표시하고 있다.
Silva 99% OTU에서는 "Bacteria;Firmicutes;Clostridia;Oscillospirales;Oscillospiraceae;uncultured;gut metagenome"의 taxnomy를 가진 것도 존재
Marker gene reference databases
QIIME에서 사용할 수 있도록 fommating이 되어있다.
- Greengenes (16S rRNA)
- Silva (16S/18S rRNA)
- UNITE (fungal ITS)
Microbiome bioinformatics benchmarking
프로그램 성능을 테스트하기 위한 public mock community data를 다운받을 수 있다. Mock communites란, isolated microorganisms를 특정 abundance 비율로 pooling해서 만들어진 인공적인 communites를 말한다. Abundance 비율을 우리가 알고 있기 때문에 성능 테스트에 사용될 수 있다.
Public microbiome data
- Qiita: public microbiome datasets을 둘러보고, meta-analysis를 수행할 수 있다.
SEPP reference databases
q2-fragment-insertion에 사용할 수 있는 database가 존재한다.
Reference
'Bioinformatics > Metagenomics' 카테고리의 다른 글
[용어 설명] Microbiome, Microbiota, Metagenome 차이 (0) | 2021.07.01 |
---|---|
[QIIME2] 주로 사용하는 QIIME2의 plugins 정리 (0) | 2021.03.31 |
[QIIME2] Training feature classifiers with q2-feature-classifier 튜토리얼 (0) | 2021.03.30 |
[QIIME2] Paired-end reads를 Deblur로 분석하는 방법 (using Aritifact API) (0) | 2021.03.09 |
[QIIME2] QIIME의 3가지 Interface (CLI, GUI, Python API) (0) | 2021.03.05 |