Bioinformatics/Metagenomics 31

[마이크로바이옴] Huttenhower 랩 프로그램 정리: MetaPhlAn, HUMAnN 등

Huttenhower 랩(하버드대)에서는 마이크로바이옴 분석과 관련된 굉장히 유명한 프로그램들을 만들었다 (MetaPhlAn, HUMAnN 등). 어떤 툴이 있는지 간단히 정리해보았다. https://huttenhower.sph.harvard.edu/tools/ Tools – The Huttenhower Lab Microbial Community Profiling Tools huttenhower.sph.harvard.edu MetaPhlAn: Shotgun sequencing data로부터 taxonomic profile을 return. HUMAnN: Shotgun sequencing data로부터 funcitonal profile을 return. 이때 각 functional feature가 어떤 세균으..

[QIIME 2] 마이크로바이옴 분석에서 사용되는 파일 종류 (Import, Export)

Amplicon data를 분석할 때 주로 사용되는 Data type의 종류 및 import/export를 정리하였다. 위의 Data types가 amplicon data 분석에서 생성되는데, taxonomic analysis 및 diversity analysis에서 사용될 수 있다. 이 파일들을 하나씩 어떤 형식으로 되어 있으며, 어떻게 export/import할 수 있는지 알아보았다. 1. FeatureTable[Frequency] # Denoising $ qiime deblur denoise-16S --p-sample-stats --i-demultiplexed-seqs demux.qza --o-representative-sequences repSeqs.qza --o-table table.qza --..

Metagenomic Taxonomic Profiling | 관련 툴의 종류 (MetaPhlAn, Kraken, Kaiju)

Shotgun metagenomic samples을 분석하여 어떤 세균 구성으로 되어있는지(metagenomic taxonomic profiling) 알아내는 여러 종류의 툴이 존재한다. 이를 각각 알아보고자 한다. 참고로 NBCI에서 raw data를 받은 이후에 quality control (QC)은 일반적으로 필요하다 (Trimmomatic 등으로 human reads 제거 등). 한편 paired-end joining 단계는 보통 필요 없는데, 이는 profling tool 자체가 joining이 되지 않은 두 파일을 각각 받을 수 있기 때문에 생략 가능하다. MetaPhlAn 3 MetaPhlAn 3는 bioBakery 3에 포함된 abundance estimation program이다. Met..

[NCBI SRA] 마이크로바이옴 데이터 다운로드 | fastq-dump 설치 및 실행

NCBI Sequence Read Archive (SRA)는 마이크로바이옴 데이터(raw sequencing data 및 alignment information)가 저장된 데이터베이스이다. 웹페이지에서 Experiment Accession을 검색하면 해당 실험에 포함된 run file을 다운로드 받을 수 있다. FASTA/FASTQ : Download : Sequence Read Archive : NCBI/NLM/NIH trace.ncbi.nlm.nih.gov fastq-dump 한편, Linux 환경에서 특정 프로그램을 사용하여 다운로드 받을 수도 있는데, 그때 사용하는 프로그램이 fastq-dump이다. 그를 위해서는 SRA Toolkit을 설치해야한다. Linux 안에서 환경에 맞는 버전(아래 페이..

[HMP] Human microbiome project란? | 개념 정리

NIH Human Microbiome Project Human Microbiome Project (HMP)은 National Institutes of Health (NIH) Common Fund의 지원을 받아 진행된 프로젝트로, 마이크로바이옴과 사람 건강의 연관성을 이해하기 위해 다량의 human microbiome samples를 생성하였다. 크게 두 단계로 진행되었다. HMP1: 300명의 건강한 성인에서 다섯 군데 신체 부위(nasal passages, oral cavity, skin, gastrointestinal tract, urogenital tract)를 16S rRNA sequencing 및 shotgun sequencing으로 알아본 프로젝트. 16S rRNA sequencing을 바탕으..

[용어 설명] Metagenome과 Metatranscriptome

아래에서 metagenome과 metatranscriptome에 관해 정리된 그림을 확인할 수 있다. 먼저 샘플에서 DNA를 뽑은 이후에 목적에 따라 두 종류의 데이터를 얻을 수 있다. Amplicon data: 16S rDNA만 증폭한 데이터. 위 그림에서는 sequencing 이후에 16S rDNA를 뽑아서 분석하는 것처럼 묘사하였는데, 실제로는 일반적으로 sequencing을 할 때부터 16S rDNA만 증폭하여 amplicon data를 얻는다. Metagenome: 샘플에 존재하는 모든 sequence를 증폭한 데이터. Active microbes와 inactive microbes의 구분은 할 수 없다. 한편, 샘플에서 RNA를 뽑은 이후에도 두 종류의 데이터를 얻을 수 있다. 이런 분석을 하는..

[생물정보학] 배양하지 못한 미생물의 유전체: SAG와 MAG

일반적으로 세균 등의 미생물 유전체(genome)를 얻기 위해서는 배양(culture)을 하고, 생성된 colony로부터 DNA를 얻는 과정이 필요하다. 하지만 최근에는 이런 배양 과정 없이 미생물의 유전체를 얻는 방법이 등장하고 있으며, 그러한 유전체의 종류에는 single amplified genome (SAG)와 metagenome-assembled genome (MAG)이 있다. 이 논문에 SAGs와 MAGs의 역사 (Figure 1) 및 생성 과정 (Figure 2)이 잘 나와있다. 생성 과정을 요약하면 아래와 같다. Single amplified genome (SAG) Environmental sample Single-cell isolation & Whole genome amplificatio..

[생물정보학] 마이크로바이옴 데이터 분석 방법 및 개념 (amplicon data)

이 포스팅에서는 마이크로바이옴 데이터를 어떻게 분석하는지, 관련 개념에는 무엇이 있는지 개괄적으로 알아보고자 한다. 분석 데이터 일반적으로 마이크로바이옴 분석은 amplicon data를 사용하여 분석한다. 여기에서 amplicon이란, "a piece of DNA or RNA that is the source and/or product of amplification or replication events" (1)을 의미한다. 즉, 마이크로바이옴 분석은 샘플에 굉장히 많은 종류의 DNA가 있을 때, 이 중 일부의 DNA 조각만 증폭한 데이터 (amplicon data)를 사용하여 보통 분석한다. 그럼 어떤 종류의 DNA 조각을 증폭할까? 마이크로바이옴을 구성하는 세균에 대해서 분석을 할 때 사용하는 것이..

[Alpha diversity] Diversity metrics 비교 (Species richness, Species evenness)

샘플 내 다양성을 파악하기 위해 우리는 alpha diversity를 계산한다. 그런데 다양한 종류의 diversity metrics가 존재하며, 어떤 metric이 유의하게 높더라도 다른 metric은 유의하지 않을 수도 있다. 그렇다면 이러한 metrics 간에 어떠한 차이가 있는지 알아보았다. Commonly used estimates for alpha diversity Species richness Species richness는 샘플이 다양한 종을 포함할수록 값이 커진다. 예를 들어 샘플_1은 OTU A, B를 가지고 있고, 샘플_2는 OTU A, B, C를 가지고 있을 때 species richness는 샘플_2보다 샘플_1에서 더 크다. 이러한 species richness를 나타내는 met..

728x90
반응형