전체 글 231

[R package] ggplot 오브젝트를 쉽게 합쳐주는 patchwork

R에서 그림을 그릴 때 주로 ggplot2를 사용한다. 이때 다수의 그림을 그려야하는 상황에서 그림 하나씩을 따로 출력하거나 저장할 수도 있지만, 미리 합쳐두고 출력하거나 저장하면 더 간단히 자료 정리가 가능하다. 이럴 때 활용할 수 있는 패키지로 patchwork가 있다. https://patchwork.data-imaginist.com/ The Composer of Plots The ggplot2 package provides a strong API for sequentially building up a plot, but does not concern itself with composition of multiple plots. patchwork is a package that expands the A..

Computer Science/R 2023.10.09

[Microbiome] Metabolites의 개념과 microbiome과의 관계: SCFAs와 Bile acids

Metabolites (대사체)는 효소를 통해 이루어지는 metabolism의 intermediate or end product를 의미하며, 주로 sugar, lipid, amino acids, nucleotides 등의 small molecules를 의미한다 (proteins와 비교하여 더 작다) [1,2]. 크게 primary metabolite와 secondary metabolite로 구분할 수 있다.Primary metabolite: 생장과 관련된 metabolite.Secondary metabolite: 생장과 관련되지 않은 metaboliteMetabolites는 Biocrates사 제품을 통해 targeted 방식으로 측정하거나, LC-MS를 통해 targeted/untargeted 방식으로..

[Microbiome] Prebiotics, Probiotics, Synbiotics, Postbiotics, Pyschobiotics의 개념

ChatGPT에게 Prebiotics, Probiotics, Synbiotics, Postbiotics, Pyschobiotics의 개념에 대해서 물어보았다. Prebiotics: Non-digestible food ingredients that selectively stimulate the growth of beneficial bacteria. Inulin, fructooligosaccharides (FOS)등이 해당. Probiotics: Live microorganisms that, when administered in adequate amounts, confer health benefits. Lactobacillus, Bifidobacterium 등이 해당. Synbiotics: Combinati..

[DATAtab] 여러 가지 통계 테스트의 기본 개념 설명 및 계산 사이트

아래 DATAtab이라는 사이트가 굉장히 유용해보여서 가져왔다. https://datatab.net/ t-Test, Chi-Square, ANOVA, Regression, Correlation... Webapp for statistical data analysis. datatab.net 사이트에 들어가보면 여러 가지 탭이 존재하는데, 특히 Tutorials와 Statistics Calculator이 유용하였다. Tutorials에서는 여러 가지 통계 테스트의 기본 개념들을 설명해주고, Statistics Calculator에서는 직접 데이터를 넣었을 때 어떤 통계 테스트가 가능한지, 그 결과가 어떤지 등을 확인할 수 있었다.

Study/Resource 2023.04.23

[Jupyter] 주피터에서 Dataframe 이쁘게 출력하기 및 더 많은 행과 열 확인 (R, Python)

Dataframe 이쁘게 출력하기 R이든 Python이든 Jupyter에서 코드 cell 마지막 줄에서 DataFrame을 불러오면 이쁘게 Dataframe이 출력된다. 이는 아래 그림과 같이 단순히 print로 dataframe을 출력했을 때와 다르다. 코드로 Dataframe을 이쁘게 출력하기 위해서는 R에서는 IRdisplay::display(df) Python에서는 from IPython.display import display, HTML display(df) # display(HTML(df.to_html())) 로 할 수 있다 [1]. Dataframe의 더 많은 행과 열 확인 한편, 열의 수나 행의 수가 너무 많다면, Jupyter에서는 중간을 생략하고 처음 부분과 끝 부분만 보여준다. 이런 ..

[Jupyter] 주피터에서 Table of contents (TOCs) 확인

Jupyter에서 코드를 작성할 때 마크다운과 함께 정리를 하는데, 이때 마크다운에서 작성한 제목을 table of contents로 한번에 확인할 수 있다. 왼쪽에 있는 창에서 세 번째 버튼을 클릭하면 table of contents를 확인할 수 있고, 항목을 누르면 해당 위치로 바로 이동할 수 있다. 작성한 코드가 너무 길 때 유용하게 사용할 수 있는 방법이었다.

[ChatGPT] ChatGPT를 연구에 활용할 수 있는 방안

사용자의 프롬프트에 반응하여 디테일한 답변을 내놓을 수 있는 모델인 ChatGPT (Chat Generative Pre-trained Transformer) [1]. 답변 중에 거짓 정보도 많지만 정말 성능이 대단해서 놀랍고, 특히 발전 속도가 무서울 정도로 빠른 것 같다. 이번 포스팅에서는 ChatGPT를 어떤 식으로 연구에 활용할 수 있을지 정리하였다 (추가로 더 생기면 업데이트 예정). 1. 정보 검색 ChatGPT의 등장으로 구글 등의 검색 엔진이 위협받는다는 말이 있을 정도로 ChatGPT는 필요한 정보를 빠르게 요약해서 답변해줄 수 있다. 물론 해당 내용이 거짓일 수 있기 때문에 진위를 가릴 필요성은 있지만, 대강의 내용을 빠르고 쉽게 파악할 수 있었다. 예를 들어, 아래처럼 그람양성균과 그람..

Study/Tip 2023.03.27

[마이크로바이옴] Huttenhower 랩 프로그램 정리: MetaPhlAn, HUMAnN 등

Huttenhower 랩(하버드대)에서는 마이크로바이옴 분석과 관련된 굉장히 유명한 프로그램들을 만들었다 (MetaPhlAn, HUMAnN 등). 어떤 툴이 있는지 간단히 정리해보았다. https://huttenhower.sph.harvard.edu/tools/ Tools – The Huttenhower Lab Microbial Community Profiling Tools huttenhower.sph.harvard.edu MetaPhlAn: Shotgun sequencing data로부터 taxonomic profile을 return. HUMAnN: Shotgun sequencing data로부터 funcitonal profile을 return. 이때 각 functional feature가 어떤 세균으..

[FastQC] High throughput sequencing data의 quality 검정

Sequencing data를 얻었을 때 해당 데이터의 quality가 얼마나 좋은지 확인을 해볼 필요가 있다. 이때 가장 일반적으로 사용되는 프로그램 중 하나가 FastQC이다. 1. FastQC 설치 먼저 아래 페이지에 들어가서 FastQC v0.11.9 (Win/Linux zip file)를 다운로드 받고, 압축을 풀어준 이후, 프로그램 폴더를 PATH에 등록해준다 (Java가 없다면 설치를 해줘야 한다 [1]). https://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqc Babraham Bioinformatics - Public Projects Download Download Babraham Bioinformatics Proje..

Bioinformatics/etc. 2023.02.04
728x90
반응형