Bioinformatics/Transcriptomics

KEGG 데이터베이스에서 유전자 검색 | KEGG 데이터베이스 구조

2021. 8. 17. 11:57

KEGG 데이터베이스에서는 유전자의 다양한 정보를 얻을 수 있다. 예를 들어, 사람의 GCLM 유전자에 대해 관심이 있다고 해보자.

KEGG 홈페이지에서 해당 유전자를 검색하면 아래와 같은 결과를 얻을 수 있다.

검색 결과는 KEGG GENES와 KEGG ORTHOLOGY로 나뉘어진다. KEGG GENES는 여러 종(사람, 쥐 등)에서 존재하는 각각의 유전자들을 의미하고, KEGG ORTHOLOGY는 그러한 유전자들의 집단인 ortholog (한 조상으로부터 유래한 같은 기능의 유전자 집단)를 나타낸다. 즉, 사람에 존재하는 GCLM 유전자의 KEGG ID는 hsa:2730이며, 유전자가 속하는 ortholog의 KEGG ID는 K11205이다.

이때 KEGG GENES 중에 속하는 ortholog가 없는 경우도 존재하니 참고. 그리고 KEGG ORTHOLOGY는 단순히 similarity를 바탕으로 clustering한 결과가 아니라 다른 방식으로 내용이 증명된 것을 사용하고, similarity로 clustering된 결과는 Ortholog Cluster로 따로 제공하는 것 같았다 (https://www.genome.jp/tools/oc/).

 


 

위 검색결과에서 K11205와 hsa:2730를 클릭하면 아래와 같은 창이 나타난다.

https://www.kegg.jp/entry/K11205

  • Pathway: KO가 속한 pathways를 나타낸다.
  • Module: KO가 속한 module을 나타낸다. Module은 시작 compound에서 중간 compound를 거쳐 최종 compound에 도달하는 하나의 경로를 말한다.
  • Brite: 기능 (function) 정보를 계층 구조로 나타낸 것으로, 하나의 KO가 여러 기능을 할 수도 있기 때문에 여러 곳에 속할 수 있다 (taxonomy와 다른 점)
  • 해당 KO에 포함되는 genes를 확인할 수 있다.

 

https://www.kegg.jp/entry/hsa:2730

  • Pathway: 유전자가 속한 pathway를 나타낸다.
  • Module: 유전자가 속한 module을 나타낸다.
  • Network: 유전자가 속한 network를 나타내며, network는 element로 구성되어 있다. 아마 pathway보다 작은 단위인 것 같다.
  • Brite: 기능 정보를 계층 구조로 나타낸 것
  • 다른 데이터베이스와 정보가 연결되어 있다.
  • Sequence 정보를 확인할 수 있다.

 

 

 

728x90
반응형