전체 글 231

[통계] Independent filtering의 개념 (DESeq2)

두 그룹 간 abundance가 유의하게 다른 feature를 찾을 때 DESeq2 등의 differential gene expression (DEG) analysis tool을 사용할 수 있는데, DESeq2에 independent filtering이라는 개념이 있었다. 일반적으로 다수의 가설을 검정할 때 false positive(맞다고 했는데 틀림)의 수가 늘어날 수 있기 때문에 이를 보정하기 위해 multiple testing correction을 수행한다. DEG 분석 수행 시에도 각각의 features에 대해 검정을 수행하기 때문에 multiple testing correction을 하는 것이 일반적이다. 그런데 multiple testing correciton을 통해 false positiv..

Statistics 2023.01.28

[Nature] Method of the Year 2022: long-read sequencing

Nature Method 저널에서는 매년 초 작년 한 해 주목 받았던 분석 기술을 선정한다 🎉. Year Method of the Year Reference 2022 Long-read sequencing [7] 2021 Protein structure prediction [6] 2020 Spatially resolved transcriptomics [5] 2019 Single-cell multimodal omics [4] 2018 Imaging in freely behaving animals [3] 2017 Organoids [2] 2016 Epitranscriptome analysis [1] 2022년은 long-read sequencing이 선정되었다. 기술이 발전하여 점점 더 길게 sequencin..

[Linux] 같은 파일인지 확인할 때 쓸 수 있는 md5sum 명령어

종종 큰 파일을 다운 받을 때, 중간에 파일에 문제가 생기지는 않았을까 의심이 될 때가 있다. 그럴 때 md5sum 명령어를 활용하면 좋다. 이는 파일의 MD5 hash를 계산해주는데 서로 다른 파일이 같은 MD5 hash를 가질 확률은 굉장히 낮다 [1]. 그래서 이를 이용하여 서로 같은 파일인지 확인할 수 있다. $ touch test.txt $ md5sum test.txt d41d8cd98f00b204e9800998ecf8427e test.txt $ echo "HI" > test.txt $ cat test.txt HI $ md5sum test.txt 39d2b1ae41c609d04d9bbcde036940d8 test.txt $ mv test.txt test2.txt $ md5sum test2.txt..

[R] 색깔 팔레트를 통한 Figure 색 지정 (RColorBrewer 등)

R로 데이터를 만들 때 색깔을 어떻게 할지 고민이 될 때가 많다. 이때 RColorBrewer 패키지를 사용하면 원하는 색깔 팔레트를 골라서 이쁜 색감의 figure를 그릴 수 있다 (https://r-graph-gallery.com/38-rcolorbrewers-palettes.html). 색깔이 어떤식으로 나오는지 미리 보기 위해서는 아래 사이트를 이용할 수 있다. https://colorbrewer2.org/#type=sequential&scheme=BuGn&n=3 ColorBrewer: Color Advice for Maps colorbrewer2.org 한편, 많은 수의 카테고리 데이터를 다룰 때 색깔이 구분이 안되는 경우가 종종 있다. 이를 해결하기 위한 방법 중 다음의 stackoverflo..

Computer Science/R 2022.10.01

[R] 데이터 프레임 (Data Frames) 다루기

Python이든 R이든 데이터 프레임 (Data Frames)은 데이터 분석 시 가장 잘 다뤄지는 형식 중 하나이다. 이번 포스팅에서는 R에서 데이터 프레임을 다루는 기본적인 코드들을 정리하였다. 기본 코드 library(dplyr) library(tidyverse) # Generate a data frame. df % filter(column %in% 'value1') # Pull df %>% pull(column1) # return a list of values from 'column1' # Ordering df %>% arrange(-A) # same with dplyr::arrange(df, -A) # Merge rownames(df) = c(1,2,3,4,5) df2

Computer Science/R 2022.07.02

[Microsoft OneNote] 타이핑시 글자 사라짐 현상 | 해결 방법

Microsoft OneNote는 여러 종류의 필기들을 카테고리로 분류할 수 있고, 동기화를 통해 여러 기기에서 작성한 필기들을 확인할 수 있다는 장점이 있어 자주 사용하고 있다. 그런데 종종 필기를 할 때 글자가 한두개씩 사라지는 문제가 있어서 검색을 해보았다. 여러 글이 검색되는 것을 보면 나만의 문제는 아닌 것 같았다. 아래 글을 참고하여 옛한글 입력기를 추가하고 이를 이용해서 필기를 하니 문제가 사라졌다 🙆‍♂️ ([Windows]+[Space]로 입력기 변환 가능). 원노트 OneNote 한글 누락(씹힘) 현상 해결 원노트 OneNote 한글 누락(씹힘) 현상 해결 환경: OneNote for Windows 10 원노트에 글자가 완성되지 않고 다음으로 넘어가면서 누락되는 현상이 있습니다. 원노트..

Study/Tip 2022.07.02

[GitHub] 폴더 내 코드를 GitHub에 백업하는 방법

아래의 과정을 거쳐 로컬 컴퓨터의 특정 폴더에 들어있는 코드 전부를 GitHub에 백업할 수 있다. 1. GitHub에서 repository 생성하기 우상단의 +를 클릭 > [New repository] > Repository 이름 입력 > (외부로 공유하고 싶지 않을 시 Private 체크) > [Create repository] 2. GitHub에서 personalized token 생성 [Settings]>[Developers settings]>[Personal access tokens]>[Generate new token] Note 및 적절한 scopes (repo 등) 선택 후 [Generate token] 생성된 [Token] 복사 3. 로컬 컴퓨터의 폴더 내 코드를 GitHub에 업로드 로컬..

[Nature] Method of the Year 2021: Protein structure prediction (AlphaFold2)

Nature Method 저널에서는 매년 초 작년에 가장 주목받았던 분석 기술을 선정한다. Method of the Year Reference 2021 Protein structure prediction [6] 2020 Spatially resolved transcriptomics [5] 2019 Single-cell multimodal omics [4] 2018 Imaging in freely behaving animals [3] 2017 Organoids [2] 2016 Epitranscriptome analysis [1] 2021년은 Protein structure prediction이 그 자리를 빛냈다. 이는 AlphaFold2가 발표되어 단백질 구조 예측에 큰 기여를 했기 때문인 것 같다. [7..

[GitHub] Gist를 활용한 코드 (Jupyter notebook) 공유

티스토리 블로그에서도 코드블럭을 사용하여 간단한 코드를 공유할 수 있지만, Jupyter notebook file(.ipynb)은 공유하기 어려운 단점이 있다. 이때 GitHub Gist를 활용하면 Jupyter notebook file을 깔끔한 형식으로 공유할 수 있어서 코드 뿐 아니라 실행 결과 등을 한번에 확인할 수 있다는 장점이 있다. GitHub Gist를 활용하는 방법은 굉장히 간단하다. 먼저 GitHub에 들어가서 [New gist]를 클릭한다. 그러면 아래와 같은 창이 나온다. [Gist description]을 통해 코드 설명을 적을 수 있고, [Add file]을 통해 여러 개의 파일을 한번에 올릴 수도 있다. Jupyter notebook을 작성한 후 해당 파일(220226_first..

728x90
반응형