분류 전체보기 231

[Java] 이클립스에서 실행 가능한 JAR 파일 만들기

JAR (Java ARchiv) 파일은 여러 자바 클래스파일 및 라이브러리를 하나로 압축한 파일로서, 프로그램 배포에 유용하게 사용될 수 있다. 이클립스를 활용하면 간단히 JAR파일을 생성할 수 있다. 먼저 main 메소드가 있는 클래스 혹은 프로젝트에 대해 [오른쪽 클릭]>[Export]를 누른다. 다음에서 JAR file을 클릭하여 [Next]를 누른다. [Next]를 누른다. [Save the description of this JAR in the workspace]를 설정하면 설정이 저장되어 다음 번에 더 빠르게 JAR 파일을 생성할 수 있다. 마지막으로 main 메소드를 가진 클래스 파일을 찾아 Main class로 지정하면 완료된다. 생성된 jar 파일은 아래의 command로 동작한다. $ ..

[Linux] 유용한 쉘 명령어 (Shell commands) 모음

Shell commands의 중요성 Unix는 간단하고 굉장히 빠른 툴로 구성된다: 각각의 툴은 하나의 작업만 수행함. 이들의 조합으로 복잡한 작업을 해낼 수 있다. 파일에서 필요한 정보를 뽑거나 rough하게 확인할 때 유용하다: ex) GFF 파일 (General Feature Format)을 전반적으로 확인하는 등 Redirection (Shell operators: >, , (write to file) >를 사용하면 stdout의 내용을 파일에 적을 수 있다. Redirection: < (read from file) file1.sorted # 각 행의 개수 세기 $ sort file.txt | uniq –c # 각 행의 개수로 정렬 $ sort file.txt | uniq –c | sort –nr..

KEGG 데이터베이스에서 유전자 검색 | KEGG 데이터베이스 구조

KEGG 데이터베이스에서는 유전자의 다양한 정보를 얻을 수 있다. 예를 들어, 사람의 GCLM 유전자에 대해 관심이 있다고 해보자. KEGG 홈페이지에서 해당 유전자를 검색하면 아래와 같은 결과를 얻을 수 있다. 검색 결과는 KEGG GENES와 KEGG ORTHOLOGY로 나뉘어진다. KEGG GENES는 여러 종(사람, 쥐 등)에서 존재하는 각각의 유전자들을 의미하고, KEGG ORTHOLOGY는 그러한 유전자들의 집단인 ortholog (한 조상으로부터 유래한 같은 기능의 유전자 집단)를 나타낸다. 즉, 사람에 존재하는 GCLM 유전자의 KEGG ID는 hsa:2730이며, 유전자가 속하는 ortholog의 KEGG ID는 K11205이다. 이때 KEGG GENES 중에 속하는 ortholog가 없..

[Java] 이클립스 (Eclipse IDE) 설정 | 테마, Build path, Java version

Java 코드를 작성할 때 이클립스 (Eclipse IDE)를 사용할 수 있다. 이때 여러가지 설정을 추가로 해줄 수 있는데 아래와 같다. 테마 설정 눈 보호?를 위해 검은색 테마를 설정하고자 한다면 아래와 같이 할 수 있다. [Window] > [Preferences] > [Appearance] > [Theme] > [Dark] Build path 설정 이클립스에서 여러 프로젝트를 함께 다룰 수 있다. 이때 '프로젝트 A'의 내용을 '프로젝트 B'로 import 하고자 할 때는 Build path를 설정해줘야 한다. [프로젝트 B 우클릭] > [Properties] > [Java Build Path] > [Projects] > [Add...] > [프로젝트 A 추가] Java version 설정 특정 ..

[Java] Ant Build를 통한 local에서 server로의 자바 클래스 파일 이동

Ant Build를 이용하면 Local에서 작성한 자바 코드의 클래스 파일을 Server 내부로 이동시킬 수 있다. 먼저 다음의 build.xml을 만든다. build.xml을 project1 폴더에 위치시킨 후, 이클립스(Eclipse IDE)에서 [오른쪽 버튼 클릭] > [Run as] > [Ant Build]를 누르면 /javaClass/에 자바 클래스 파일이 ftp를 통해 자동으로 들어간다. Ant Build 이후에는 java [package 명].[파일명]으로 server에서 실행이 가능하다. 만약 이클립스에서 특정 jar 파일이 없어서 Ant Build가 실행이 안된다면, 해당 jar 파일을 웹에서 다운로드+적절한 위치로 옮겨준 후, [Window] > [Preferences] > [Ant] ..

[용어 설명] Metagenome과 Metatranscriptome

아래에서 metagenome과 metatranscriptome에 관해 정리된 그림을 확인할 수 있다. 먼저 샘플에서 DNA를 뽑은 이후에 목적에 따라 두 종류의 데이터를 얻을 수 있다. Amplicon data: 16S rDNA만 증폭한 데이터. 위 그림에서는 sequencing 이후에 16S rDNA를 뽑아서 분석하는 것처럼 묘사하였는데, 실제로는 일반적으로 sequencing을 할 때부터 16S rDNA만 증폭하여 amplicon data를 얻는다. Metagenome: 샘플에 존재하는 모든 sequence를 증폭한 데이터. Active microbes와 inactive microbes의 구분은 할 수 없다. 한편, 샘플에서 RNA를 뽑은 이후에도 두 종류의 데이터를 얻을 수 있다. 이런 분석을 하는..

NGS의 구분: Single-end, Paired-end, CCS

Next generation sequencing (NGS)는 크게 Single-end sequencing, Paired-end sequencing, Circular consensus sequencing (CCS)로 구분할 수 있다. Single-end sequencing (Roche 454, Ion Torrents): DNA fragment의 한쪽 끝만 sequencing한다. Paired-end sequencing (Illumina): DNA fragment의 양쪽 끝을 sequencing한다. 이때 각 paried read 사이의 거리를 알고 있기 때문에 repetitive regions에 대하여 더 정확하게 alignment를 할 수 있다 (1). 한편, 아래 그림의 경우에는 read가 겹치는 ov..

Bioinformatics/etc. 2021.08.12

[계통수] Phylogenetic tree란? | MEGA X를 이용한 계통수 생성

Phylogenetic tree란? 계통수(phylogenetic tree)를 통해 다양한 분류군 간의 진화관계를 알 수 있다 (Sequences set이 있을 때, 이들의 다양성을 보여주는 가장 좋은 방법 중 하나이다). Phylogenetics에서는 계통수를 dendrogram이라고도 부른다 (1). 일반적으로 계통수는 1) 여러 종에서 유래한 marker gene sequences에 대해서 2) multiple sequence alignment (MSA)를 진행하고 3) 특정 phylogenetic method 및 4) 특정 모델을 사용하여 얻어진다. Phylogenetic methods는 아래와 같이 크게 distance-based와 character-based methods로 나뉜다. Dista..

[용어 설명] ROC curve와 AUC란?

ROC (Receiver Operating Characteristic) curve란 FPR (False positive rate)과 TPR (True Positive Rate)을 각각 x, y축으로 놓은 그래프이다. TPR과 FPR은 다음과 같이 정의된다. TPR (True Positive Rate): 1인 케이스에 대해 1로 바르게 예측하는 비율 (Sensitivity), 암 환자에 대해 암이라고 진단 FPR (False positive rate): 0인 케이스에 대해 1로 틀리게 예측하는 비율 (1-Specificity), 정상에 대해 암이라고 진단 이때 Sensitivity와 Specificity는 반비례한다 (Sensitivity와 1-Specificity는 비례). 모든 사람을 암이라고 진단: ..

728x90
반응형