분류 전체보기 231

[Java] 자바 기본 개념 및 클래스 파일 실행 | 이클립스

자바(Java)는 프로그래밍 언어이다. 아래 순위를 보면 Python에 밀리기는 했지만 여전히 많이 사용되는 언어임을 알 수 있다. Python보다 처음 접하기는 어렵고, C++보다는 느리다는 단점이 있지만, 웹 애플리케이션 구축 언어로 주로 사용되고 있다. 자바에는 Java SE (Standard Edition)과 Java EE (Enterprise Edition)이 있는데, 전자는 기본 버전, 후자는 서버용 애플리케이션 개발 버전이다. 둘 중에서 선택하여 필요한 버전의 구현체를 설치하면 된다. 구현체에는 JDK (Java Development Kit)와 JRE (Java Runtime Environment)가 있다. JDK (Java Development Kit): JVM + 라이브러리 API + 컴..

[생물정보학] 배양하지 못한 미생물의 유전체: SAG와 MAG

일반적으로 세균 등의 미생물 유전체(genome)를 얻기 위해서는 배양(culture)을 하고, 생성된 colony로부터 DNA를 얻는 과정이 필요하다. 하지만 최근에는 이런 배양 과정 없이 미생물의 유전체를 얻는 방법이 등장하고 있으며, 그러한 유전체의 종류에는 single amplified genome (SAG)와 metagenome-assembled genome (MAG)이 있다. 이 논문에 SAGs와 MAGs의 역사 (Figure 1) 및 생성 과정 (Figure 2)이 잘 나와있다. 생성 과정을 요약하면 아래와 같다. Single amplified genome (SAG) Environmental sample Single-cell isolation & Whole genome amplificatio..

[Adobe] 동영상 파일 용량 줄이는 방법 (Media Encoder)

대용량의 동영상은 Adobe Media Encoder를 통해 그 크기를 줄일 수 있다. 먼저 Media Encoder를 실행한 후 [파일]>[소스 추가]로 크기를 줄이고자 하는 영상을 불러온다. 그 후, 사전 설정을 원하는 항목으로 바꿔준다. 720p와 같은 작은 해상도를 사용하는 사전 설정을 적용하면 용량이 줄어든다 (위에서는 YouTube 720p HD 선택). 설정 후 오른쪽 위의 초록색 재생 버튼을 누르면 인코딩 프로세스가 시작된다. 약 2GB의 1시간 길이 영상이 20분에 걸쳐 (GPU 사용률이 거의 100%...😮) 600MB로 확 줄었다 ✨. Reference https://www.adobe.com/kr/creativecloud/video/discover/reduce-video-size.ht..

Study/Tip 2021.08.03

[용어 설명] SNP (single-nucleotide polymorphism)와 SNV (single-nucleotide variant) 차이

Single-nucleotide polymorphism (SNP)는 "germline substitution of a single nucleotide at a specific position in the genome."라고 정의되어 있다 (1). 즉, 어떤 집단에서 특정 single nucleotide가 굉장히 적은 비율로 유전된다면 이를 SNP라고 한다. 예를 들어, 한국인의 유전자 A가 일반적으로 "ATACTGTGCA"로 되어있는데, 그 중 굉장히 적은 비율의 사람에서 유전자 A가 "ATACTATGCA"라면, 하나의 SNP가 있다고 말할 수 있다. 비율은 일반적으로 1% 이상을 사용한다고 한다 (너무 적은 비율의 경우는 SNP라고 하지 않고, SNV라고 한다). Single-nucleotide var..

Bioinformatics/etc. 2021.08.02

[Research] 노화에 따른 사람 gut microbiome의 변화: 건강한 노인의 경우, Bacteroides가 점차 감소

정리 사람의 장내 미생물 군집에서는 대부분 genus Bacteroides가 발견된다. 하지만 건강한 노인의 경우 Bacteroides가 점차 감소한다는 것이 밝혀졌다: gut microbiome의 compositional uniqueness 증가, 혈액에 특정 microbial metabolite 관찰 가능 반면, 나이가 들어도 Bacteroides의 비율이 유지되는 사람의 경우는 생존률이 낮았다. Reference Wilmanski, Tomasz, et al. "Gut microbiome pattern reflects healthy ageing and predicts survival in humans." Nature metabolism 3.2 (2021): 274-286.

Study/Paper Summary 2021.08.01

[illumina] Sequence library의 구성 (primer, index, oligo)

Sequencing에서 가장 먼저 해야하는 일은 DNA나 RNA로부터 library를 제작하는 일이다. 마이크로바이옴 분야에서 amplicon sequencing library가 어떻게 제작되고 구성은 어떤지 확인하였다. overhang adapter sequence(non-biological sequence)와 locus‐specific sequence(biological sequence, 341F/805R 등)가 연결된 primer를 PCR에 사용하여 원하는 부위를 증폭(amplification)하고 library를 만든다 (3). 제작된 Dual-indexed library의 구성은 다음과 같다 (1). Rd1 SP, Rd2 SP: Sequencing을 위한 sequencing primers의 bi..

Bioinformatics/etc. 2021.07.30

[Article] 현재 각광 받는 Single-cell multiomics

내용 구성 Single-cell multiomics 분야가 각광받는 중이다: Single-cell과 관련된 다양한 종류의 정보를 함께 분석하는 것 Single-cell과 관련된 정보에는 1) gene expression, 2) methylation, 3) genetic variation, 4) protein abundance, 5) chromatin accessibility, 6) spatial information 등이 있다. 이런 정보를 결합하여 분석하는 방법들이 많이 등장하는 추세이다: scNMT-seq (1+2+5), CITE-seq (1+4) Single-cell 연구에서는 일반적으로 visualization (t-SNE, UMAP plots)을 이용한다: 각각의 세포가 하나의 점으로 표시되어 ..

Study/Paper Summary 2021.07.29

숫자로 보는 생물학 (Numbers in Biology)

Related to Genome 사람 유전체에 존재하는 protein coding genes의 수: 21,306 genes (1) (전체 유전체의 1% 가량) Human gene의 길이: 50-100kb Human gene이 평균적으로 가진 exons의 수: 6-9 exons 사람 exon의 평균적 길이: 200-300b 사람 intron의 평균적 길이: 5-10kb 사람의 유전체 길이: 6.4 billion base pairs (diploid 기준) (3) 대장균 (Escherichia coli)의 유전체 길이: 4.6 million bases (2) 세균의 유전체 길이: 0.5~16 million bases Related to Metagenome 세균의 16S rRNA gene의 길이: ~1,500 ..

[용어 설명] Exon, Intron, coding region (CDS), Open reading frame (ORF)

먼저 exon, intron, CDS의 관계는 다음과 같이 정리될 수 있다. DNA로부터 전사를 통해 precursor mRNA (pre-mRNA)가 생성되면 RNA splicing을 거쳐 mature mRNA가 된다. 이때 introns는 잘려나가고 exon만 이어붙는다 (1). 이때 단백질을 코딩하는 부분을 coding region 혹은 CDS (coding sequence)라고 부른다 (2). 즉, exon은 단지 splicing pattern을 나타내며, CDS는 exon 중간에서 exon 중간까지 이어질 수 있다. Open reading frame (ORF)이란 단백질로 번역될 수 있는 부분 (시작 codon + 종결 codon)을 말하며, 이 중에서 실제로 단백질로 발현될 수 있는 부분이 CD..

728x90
반응형