분류 전체보기 231

[통계 기초] 상관 계수의 구분: 피어슨 (Pearson), 스피어먼 (Spearman)

상관 계수(Correlation Coefficient)는 두 변수 간의 어떤 관계가 있는지 알아볼 때 사용할 수 있다. 일반적으로 상관 계수는 피어슨 상관 계수(Pearson Correlation Coefficient)를 의미하는데 [1], 이는 스피어먼 상관 계수 (Spearman Correlation Coefficient)와 구분된다. 정리하면 아래와 같다 [3].피어슨 상관 계수(Pearson Correlation Coefficient): 두 변수 사이의 linear relationship이 있는지 확인스피어먼 상관 계수 (Spearman Correlation Coefficient): 두 변수 사이의 monotonic relationship이 있는지 확인예를 들어, 선형 관계가 아니면서 증가하는 모..

Statistics 2021.10.13

[발표용 PPT 제작] 파워포인트 슬라이드 크기 조정 방법

학회 발표용 포스터를 제작할 때 주로 파워포인트를 이용한다. 이때 파워포인트 슬라이드의 크기를 발표용 포스터에 맞게 조정할 필요가 있는데, 굉장히 간단하게 슬라이드의 크기를 바꿀 수 있다. [디자인 탭 선택]>[슬라이드 크기]>[사용자 지정 슬라이드 크기 ...]를 누른다. 학회에서 요구하는 사이즈에 맞춰서 슬라이드의 크기를 정하면 된다.

Study/Tip 2021.10.10

바이오산업의 구분: 레드 바이오, 그린 바이오, 화이트 바이오

바이오산업은 크게 3가지로 구분이 될 수 있다: 레드 바이오 (RED BIO), 그린 바이오 (GREEN BIO), 화이트 바이오 (WHITE BIO). 레드 바이오: 의료·제약 분야 (백신, 신약 개발, 진단 등) 그린 바이오: 농업·식품 분야 (GMO 등) 화이트 바이오: 환경·에너지 분야 (바이오연료 등) Reference https://www.ajunews.com/view/20190429123006125 https://blog.lgchem.com/2016/10/27_2_bio-industry/

[생물정보학] Sequencing의 종류

Sequencing의 종류 Whole genome sequencing (WGS): Genome에 존재하는 variants (Single nucleotide variant, insertion, deletion/ Copy number variation)를 확인 가능 [3]. Re-sequencing: 이미 서열이 알려진 genome을 다시 sequencing [1]. De novo sequencing: 서열이 알려지지 않은 genome을 처음 sequencing [1]. Whole exome sequencing (WES): Coding region에 존재하는 variants를 확인 가능. WGS보다 저렴 [3]. Target-sequencing (Panel sequencing): 특정 유전자에 존재하는 va..

Bioinformatics/etc. 2021.10.04

[용어 설명] Antigen과 Antibody, Epitope와 Paratop의 개념

그림으로 이해하면 쉽다. Antigen: 항체에 의해 인식되는 항원 (병원체의 unique molecule). Antibody: 항원을 인식하는 항체 (B cell receptor(BCR)와 같은 sequence를 가진다). Epitope: 항원의 일부로, 항체의 paratope와 결합할 수 있다. Paratope: 항체의 일부로, 항원의 epitope와 결합할 수 있다. Reference https://en.wikipedia.org/wiki/Antibody

[용어 설명] 파라미터(Parameter)와 하이퍼 파라미터(Hyperparameter)의 구분

머신러닝 - 13. 파라미터(Parameter)와 하이퍼 파라미터(Hyper parameter) 파라미터와 하이퍼 파라미터는 명확히 다른 개념입니다. 하지만 많은 사람들이 두 단어를 혼용해서 쓰고 있습니다. 특히, 하이퍼 파라미터를 파라미터라 칭하는 오류가 많습니다. 파라미터와 bkshin.tistory.com 위 블로그 글에 둘의 구분이 잘 정리되어 있다. 결론적으로 어떤 프로그램을 돌릴 때 처음 정해서 넣어주는 값은 '하이퍼 파라미터'라고 불러야하고, 분석이 진행되면서 정해지는 값은 '파라미터'라고 부르면 될 것 같다. Reference https://bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-13-%ED%8C%8C%EB%9D%BC%..

[용어 설명] in silico, in vitro, in vivo, ex vivo의 구분

생물학 실험에서 in silico, in vitro, in vivo, ex vivo라는 용어가 자주 등장한다. 이들은 다음과 같이 정의된다. in silico experiment: 컴퓨터 시뮬레이션을 바탕으로 진행되는 실험을 의미한다 (컴퓨터 칩 속 실리콘 내를 의미). in vitro studies: 플레이트나 시험관 등 일반적이지 않은 환경에서 미생물, 세포, 분자 등을 이용하여 진행되는 연구를 의미한다 (유리병 내를 의미). in vivo studies: 살아있는 온전한 개체(분리한 조직이나 죽은 개체가 아님)로부터 진행하는 실험을 의미한다 (살아있는 개체 안을 의미). ex vivo: 개체로부터 분리한 조직(tissue)을 대상으로 한 실험을 의미한다 (살아있는 개체 밖을 의미). 보통 in si..

[용어 설명] Sequence masking이란? | Soft masking & Hard masking

Sequence masking이란 low-complexity sequence를 찾아서 이를 따로 표시하거나 제거하는 과정이다. 이때 low-complexity sequence란 1-2개의 글자가 반복되는 sequence를 말한다 (예를 들어, AAAAATAACAATAAA). 이런 low-complexity sequence는 searching이나 clustering 과정에서 문제가 될 수 있다. 그래서 masking 과정을 거치는 것이 추천된다. 이때 soft masking과 hard masking이 구분되는데, 전자는 low-complexity sequence를 소문자로 표시하는 방식이다 (예를 들어, AAAATAA를 aaaataa로). 한편, 후자는 wildcard 글자로 아예 대체해버리는 방식으로, ..

Bioinformatics/etc. 2021.10.02

[Jupyter] JupyterLab에서 Python과 R을 함께 사용하기

Jupyter에서 Python과 R을 하나의 .ipynb 파일에서 사용할 수 있는 방법이 있다. 물론 Python과 R을 커널을 일일이 바꿔가며 사용할 수도 있지만, 매번 그러기 번거로우니... 아래의 예시를 참고하자. 1번 cell: Python에서 list를 만들어서 출력한 모습. 2번 cell: R과의 연결을 위해 extension을 load 3번 cell: R을 연결하여 Python에서 생성한 list를 넘겨준 모습. 4번 cell: 한번 데이터를 R로 넘겨줬다면 다시 넘겨주지 않아도 데이터를 사용할 수 있다. 즉, rpy2를 이용해서 R을 연결하고, %%R을 cell 앞에 달아두면 R을 이용하여 데이터를 분석할 수 있다.

728x90
반응형