Bioinformatics/Genomics 5

[계통수] Phylogenetic tree란? | MEGA X를 이용한 계통수 생성

Phylogenetic tree란? 계통수(phylogenetic tree)를 통해 다양한 분류군 간의 진화관계를 알 수 있다 (Sequences set이 있을 때, 이들의 다양성을 보여주는 가장 좋은 방법 중 하나이다). Phylogenetics에서는 계통수를 dendrogram이라고도 부른다 (1). 일반적으로 계통수는 1) 여러 종에서 유래한 marker gene sequences에 대해서 2) multiple sequence alignment (MSA)를 진행하고 3) 특정 phylogenetic method 및 4) 특정 모델을 사용하여 얻어진다. Phylogenetic methods는 아래와 같이 크게 distance-based와 character-based methods로 나뉜다. Dista..

[용어 설명] Candidate phyla radiation (CPR)이란?

Candidate phyla radiation (CPR group, Patescibacteria)이란, 배양되지 않고 metagnomics나 single cell sequencing에 의해서만 알려진 세균들의 분류군이다. 굉장히 작기 때문에 nanobacteria나 ultra-small bacteria라고도 불린다. Genome size도 작고 합성에 관여하는 유전자도 없기 때문에 공생하며 사는 세균으로도 여겨진다 [참조1, 참조2]. 실제로는 70 phyla 이상으로 분류될 수 있다는 주장도 있고, 하나의 phylum이라는 주장도 있다. 기존 세균과는 다른 16S rRNA gene 구조를 가지고 있어서 16S amplicon sequencing에서는 발견되지 않는다. 더 공부해봐야 알겠지만, 실제로 있..

[EzBioCloud] EzBioCloud를 활용한 세균 동정 (Identification)

세균의 genome sequence를 얻었을 때, 이 세균이 어떤 세균인지 알기 위해서는 reference database와 비교해야한다. 그러한 과정에 EzBioCloud를 활용할 수 있는데, 이를 소개하고자 한다. EzBioCloud (https://www.ezbiocloud.net/)는 세균의 genome sequence 및 16S rRNA gene sequence를 모아놓은 데이터베이스이다. 단순히 sequence만 모아놓은 것이 아니라 이를 활용할 수 있는 다양한 툴을 제공하는데, 이를 이용해서 세균 동정을 할 수 있다. 다음과 같은 과정으로 진행된다. Genome sequence로부터 16S rRNA gene sequence 뽑아내기 [ContEst16S] 16S rRNA gene sequen..

[용어 설명] Phylogeny와 Taxonomy의 차이

아래 reference에 둘의 차이가 잘 설명되어 있다. 요약하자면, taxonomy는 organisms의 명명과 분류와 관련이 있다면, phylogeny는 organsisms의 진화적 관계와 관련이 있다. 그래서 taxonomy는 evolutionary history에 대해서는 관심이 없지만, phylogeny에서는 evolutionary history를 밝히고자 한다. Phylogeny는 taxonomy을 위해 사용될 수 있다 (Phylogenic tree를 바탕으로 organisms을 명명하고 분류할 수 있다). Reference https://www.differencebetween.com/difference-between-taxonomy-and-vs-phylogeny/ # 용어 phylogeny,..

[Newick] 계통수 표현에 사용되는 Newick tree format

Newick tree format은 괄호와 쉼표를 사용하여 계통수를 표현하는 방법이다. 즉, 계통수 그림을 텍스트화 시킨 것으로 Newick file의 확장자는 .nwk이다. 예제 아래와 같이 다양한 방법으로 나타낼 수 있다. (,,(,)); no nodes are named (A,B,(C,D)); leaf nodes are named (A,B,(C,D)E)F; all nodes are named (:0.1,:0.2,(:0.3,:0.4):0.5); all but root node have a distance to parent (:0.1,:0.2,(:0.3,:0.4):0.5):0.0; all have a distance to parent (A:0.1,B:0.2,(C:0.3,D:0.4):0.5); dista..

728x90
반응형