Bioinformatics/Metagenomics

[HMP] Human microbiome project란? | 개념 정리

2021. 8. 25. 12:39

NIH Human Microbiome Project

Human Microbiome Project (HMP)은 National Institutes of Health (NIH) Common Fund의 지원을 받아 진행된 프로젝트로, 마이크로바이옴과 사람 건강의 연관성을 이해하기 위해 다량의 human microbiome samples를 생성하였다. 크게 두 단계로 진행되었다.

  • HMP1: 300명의 건강한 성인에서 다섯 군데 신체 부위(nasal passages, oral cavity, skin, gastrointestinal tract, urogenital tract)를 16S rRNA sequencing 및 shotgun sequencing으로 알아본 프로젝트. 16S rRNA sequencing을 바탕으로 core healthy microbiome이 있는지 확인하였고, shotgun sequencing으로 human microbiome의 기능적 측면을 확인하였다. 총 32TB 이상의 데이터를 생산하였으며, 데이터는 HMP Integrated Portal에서 확인할 수 있다.
  • iHMP: 다양한 omics 기술을 활용하여 세 가지 집단(임신, IBD, Type 2 당뇨)의 시간에 따른 microbiome을 확인한 프로젝트. 데이터는 HMP1과 마찬가지로 HMP Integrated Portal에서 확인할 수 있다.

 

이를 통해 다음 다섯 가지 목표를 해결하고자 하였다.

  1. 신체 부위에 존재하는 미생물의 유전체 획득
  2. Core microbiome 확인 (HMP1과 연관)
  3. Microbiome과 질병 간의 연관성 확인
  4. 분석 기술 및 데이터베이스 생성
  5. 사람 마이크로바이옴 분석과 관련된 ethical, legal and social implications (ELSI) 점검

HMP에 의해 생성된 데이터는 Human Microbiome Project Data Coordination Center (HMPDACC)에 의해 제공된다.

 

HMP1 data

HMP1 data는 크게 sequence data와 metadata로 나뉜다.

  • Sequence data는 집단의 특성 (건강, 질병) 및 데이터의 특성 (16S metagenomic sequence, shotgun metagenomic sequence, 미생물 유전체로 나눌 수 있다).
  • Metadata는 HMP에 참여한 피험자들의 정보를 나타낸 데이터로서, Body site, Sex (male/female) 등을 나타낸다.

데이터를 활용하고자 한다면 크게 두 가지 방법으로 데이터에 접근할 수 있다.

1. NCBI Human Microbiome Roadmap Project page

NCBI의 PRJNA43021에 HMP1 data가 저장되어 있으며, PRJNA43021는 4가지 sub-projects를 포함한다 (PRJNA48489, PRJNA43017, PRJNA28331, PRJNA46305). 이들 프로젝트는 각각 다음의 정보를 가지고 있다.

  16S metagenomic sequence shotgun metagenomic sequence 미생물 유전체
건강 집단 PRJNA48489 PRJNA43017 PRJNA28331
질병 집단 PRJNA46305 PRJNA46305 PRJNA46305

2. HMP Integrated Portal

HMP Integrated Portal (HMP Data Portal)에도 HMP1 data가 저장되어 있다. 한편, legacy HMP1 Data Browser는 여러 프로젝트에서의 데이터 분석 흐름을 정리해놓은 공간이다.

 

iHMP data

iHMP data는 multi-omic data로서, 다양한 public repositories에 다양한 종류의 데이터가 저장되어 있다. 해당 내용은 iHMP Data Model에서 확인할 수 있다. HMP Integrated Portal (HMP Data Portal)에도 iHMP data가 있다고 하니 이 포탈을 참고하면 될 것 같다.

 

HMP Integrated Portal

HMP Integrated Portal (HMP Data Portal)은 HMP의 두 단계인 HMP1과 iHMP 데이터를 모두 확인할 수 있는 웹페이지이다.

https://portal.hmpdacc.org/

현재 포탈에는 18 studies, 31,596 samples, 161,265 files이 들어있다. 

 

여기에서 Studies는 HMP1 및 iHMP의 subproject을 모두 모아놓은 것으로 각각의 sample 및 files을 확인할 수 있다.

https://portal.hmpdacc.org/projects/t

 

한편, Data에서 원하는 데이터를 필터링을 거쳐 확인할 수 있다. 현재 건강한 성인의 마이크로바이옴 데이터를 확인하고 싶어 필터링 조건에 HHS를 추가하였다. 이때 sample 수는 9,727개, file 수는 43,609개가 나오는데, 갯수의 차이가 나는 이유는 하나의 sample과 관련된 여러 가지 파일이 존재할 수 있기 때문이다 (ex. 16s_raw_seq_set, 16s_trimmed_seq_set). 'File (43,609)' 텝을 누르고 원하는 파일을 클릭하면 다운로드도 가능하다.

https://portal.hmpdacc.org/search/s

 

한편, 원하는 샘플에서 원하는 파일(형식 및 내용)을 찾아 Cart에 넣을 수 있다 (카트에 넣는 것은 샘플이 아니라 파일이다). 다음과 같이 Cart에서 내가 선택한 파일의 정보를 확인할 수 있다.

https://portal.hmpdacc.org/cart

선택한 파일들을 한번에 다운로드 받을 수도 있는데, 먼저 [Download]>[File Manifest]를 통해 'hmp_manifest_[ID].tsv' 파일을 다운로드 받고, portal_client를 이용한다.

 

Reference

  1. https://www.hmpdacc.org/ (HMP 메인페이지)
  2. https://www.hmpdacc.org/hmp/ (HMP 및 HMP1 설명)
  3. https://www.hmpdacc.org/ihmp/ (HMP 및 HMPi 설명)
  4. https://portal.hmpdacc.org/ (HMP Data Portal)

 

 

 

728x90
반응형