Bioinformatics 51

[QIIME2] QIIME과 관련된 Data resources

QIIME과 관련된 data resources가 QIIME doc에 소개되어있다. 그 종류에는 다음이 있다. Taxonomy classifiers for use with q2-feature-classifier Alignment method가 아니라 machine learning based method로 taxnomic assignment를 하기 위해서는 classifier가 필요하다. 물론 classifier를 직접 만들 수 있지만 (실제로는 직접 만드는 것이 더 좋다, 아래 link 참조), 이미 만들어 놓은 classifier도 QIIME에서 제공한다. Naive Bayes classifier (Silva) Naive Bayes classifier (Greengenes) Silva 99% OTU, G..

[QIIME2] Training feature classifiers with q2-feature-classifier 튜토리얼

해당 내용은 QIIME 2 Tutorial을 바탕으로 작성된 글로, Reference의 URL에서 원본 내용을 확인할 수 있습니다. Amplicon data를 분석하여 representative sequences set(16S rDNA)을 얻었을 때, 각각의 sequence가 어느 세균으로부터 유래했는지를 알고 싶을 수 있다 (추후 composition 분석 등이 가능). 그러기 위해서는 이를 확인해주는 classifier가 필요한데, 어떻게 classifier를 만들 수 있는지 알아보는 튜토리얼이 QIIME2 tutorial에 소개되어 있다. 💡 참고로 classifier를 train하는 이유는 machine-learning-based classification method를 쓰기 위해서다. Align..

[QIIME2] Paired-end reads를 Deblur로 분석하는 방법 (using Aritifact API)

해당 내용은 QIIME 2 Tutorial을 바탕으로 작성된 글로, Reference의 URL에서 원본 내용을 확인할 수 있습니다. Python에서 QIIME을 import하여 paired-end reads를 deblur로 분석하는 방법을 알아보겠다. 해당 튜토리얼을 command line에서가 아니라 python 환경에서 실행하였다. Alternative methods of read-joining in QIIME 2 — QIIME 2 2021.2.0 documentation Alternative methods of read-joining in QIIME 2 Note This tutorial does not cover read-joining and denoising with DADA2. Instead, ..

[QIIME2] QIIME의 3가지 Interface (CLI, GUI, Python API)

QIIME2는 3가지 interface를 제공하며, 관련 내용이 QIIME 2 doc에 소개되어있다 (Reference의 URL 참고). 아래는 QIIME 2 doc을 바탕으로 작성되었다. 1. Command line interface (q2cli): 가장 일반적으로 사용할 수 있는 interface로, QIIME2의 tutorial은 모두 command line에서 진행된다. CLI의 장점은 Bash shell을 사용할 경우, tab을 통해 자동완성을 지원한다는 점이다. 2. Graphical user interface (QIIME2 Studio, q2studio): GUI 환경에서 QIIME을 돌릴 수 있는 studio도 제공하고 있다. 3. Python API (Artifact API): QIIME..

[QIIME2] Data Importing (to QIIME2 ARTIFACT) 및 Exporting (from QIIME2 ARTIFACT)

QIIME 2 Tutorial 해당 내용은 QIIME 2 Tutorial을 바탕으로 작성된 글로, Reference의 URL에서 원본 내용을 확인할 수 있습니다. 1. Data Importing QIIME2 pipeline의 input으로는 QIIME2 artifacts가 필요하다. 우리가 가진 데이터를 적절한 단계의 artifacts로 importing이 가능한데, 이를 먼저 알아보고자 한다. 1. “EMP protocol” multiplexed single-end fastq (Earth Microbiome Project) sequences/forward.fastq.gz sequences/barcodes.fastq.gz qiime tools import \ --type EMPSingleEndSequen..

[Phred Score] PHRED 33 encoded와 PHRED 64 encoded quality scores의 차이

QIIME에서 FASTQ 파일을 import할 때 Phred score가 33 encoded인지 64 encoded인지에 대한 구분이 필요하다. Phred or Q score는base의 quality score를 나타내는 것으로, base가가 잘못되었을 에러 확률을 나타낸다. P가 error probability일 때 Q와의 관계는 다음과 같다. Q=-10logP Q score는 ASCII character로 나타내는데, ASCII character와 실제 Q score 변환 관계는 아래 링크에서 찾아볼 수 있다. Quality (Phred) scores Quality (Phred) scores See also FASTQ files Average Q is a bad idea! Expected errors..

Bioinformatics/etc. 2021.03.05

[QIIME2] Atacama soil microbiome 튜토리얼

해당 내용은 QIIME 2 Tutorial을 바탕으로 작성된 글로, Reference의 URL에서 원본 내용을 확인할 수 있습니다. 데이터 정보 아타카마 사막(칠레)의 두 곳에서 구덩이를 파고 각각 세 가지의 깊이에서 퍼온 흙 샘플 (Paired-end read, Multiplexed) sample_metadata.tsv sequences/forward.fastq.gz sequences/reverse.fastq.gz sequences/barcodes.fastq.gz 데이터 분석 ''' 1. Importing ''' qiime tools import \ --type EMPPairedEndSequences \ --input-path sequences \ --output-path sequences.qza # ..

[QIIME2] Fecal microbiota transplant (FMT) 튜토리얼

해당 내용은 QIIME 2 Tutorial을 바탕으로 작성된 글로, Reference의 URL에서 원본 내용을 확인할 수 있습니다. 데이터 정보 Autism과 gastrointestinal disorders를 가진 18세 이하 사람으로부터 유래한 amplicon data (Illumina MiSeq). 이 중 5명은 FMT를 받았고, 다른 5명은 control일 때, 어떤 변화가 있는지 파악하려고 함. 각 개인마다 6~16개의 sample이 포함됨. 또한 FMT에 사용된 fecal matrial 5개 샘플도 포함됨. sample-metadata.tsv demux.qza: demultiplexed sequences from fastq-formatted data 데이터 분석 Demultiplexed sequ..

[Diversity] 다양성 지표 (Alpha diversity, Beta diversity)

Alpha diversity는 샘플 '내' 다양성을 나타내고, Beta diversity는 샘플 '간' 다양성을 나타낸다. Alpha 및 beta diversity를 나타내는 데 사용되는 수식은 하나가 아니라 다양하게 존재하는데, 그 종류는 다음과 같다. Alpha diversity metrics Shannon’s diversity index (a quantitative measure of community richness) Observed Features (a qualitative measure of community richness) Faith’s Phylogenetic Diversity (a qualitiative measure of community richness that incorporates..

[QIIME2] Moving Pictures 튜토리얼 (QIIME 분석에서 가장 기본이 되는 내용)

해당 내용은 QIIME 2 Tutorial을 바탕으로 작성된 글로, Reference의 URL에서 원본 내용을 확인할 수 있습니다. 이 튜토리얼이 튜토리얼 중 가장 핵심이 되는 내용을 담고 있다. 데이터 정보 Human microbiome samples (Illumina HiSeq, V4 16S rRNA sequence): 항생제 사용의 영향을 보기 위해 두 사람 몸의 네 곳에서 다섯 번 얻은 샘플들 input/barcodes.fastq.gz input/sequences.fastq.gz (multiplexed, single end sequencing) sample-metadata.tsv gg-13-8-99-515-806-nb-classiier.qza: Classifier 데이터 분석 # 1. IMPORT..

728x90
반응형