Study 78

[Google Shell] 무료로 이용 가능한 Google Cloud Shell

Windows 사용자도 Google cloud shell을 통해 shell을 써볼 수 있다. 로그인 - Google 계정 하나의 계정으로 모든 Google 서비스를 Google 계정으로 로그인 accounts.google.com 구글 계정만 있으면 무료로 사용이 가능하다. 위에서 [무료로 시작하기]를 누르면 신용카드 정보를 요구하는 창이 나오는데, 그 대신 [Console로 이동]을 누르면 그런 정보를 입력할 필요 없이 바로 사용이 가능하다. 터미널은 오른쪽 상단에 터미널 열기 버튼을 누르면 열 수 있다. 다음의 + 버튼을 눌러서 새로운 shell editor를 열 수 있다 (여러 개의 shell editor를 한번에 사용 가능) 단점 위 서비스는 무료인 만큼 몇가지 단점이 존재한다. 장치에 접속하는 데..

Study/Resource 2021.05.17

[Article] SARS-CoV-2에 대한 굉장히 효율적인 진단 및 Genotyping을 위한 실험 방법

정리 Generalized version of the RNAmediated oligonucleotide Annealing Selection and Ligation with next generation DNA sequencing (RASL-seq) assay, called “capture RASL-seq” (cRASL-seq)에 대한 내용. 위 방법을 사용하면 기존의 방법보다 후러씬 간단하게 COVID-19 환자를 진단할 수 있다. 그리고 genotyping까지 가능하기 때문에 바이러스가 어떻게 퍼지는지 추론할 수도 있다. 이는 RNA를 capture할 때 cDNA로 바꿔준 후 capture하는 것이 아니라 RNA 상태에서 바로 capture하는 방법이다. 각 pathogen을 capture하기 위한 pr..

Study/Paper Summary 2021.05.17

[Perspective] Alpha diversity를 측정할 때의 문제점 및 개선 방향

내용 구성 Microbiome 데이터 분석 시 Measurement Error (Variance)가 존재한다 (Read 수가 달라지기 때문 등, 샘플을 얻을 때마다 계산되는 diversity 값이 달라질 수 있다). 하지만 현재 이러한 measurement error를 microbial diversity 연구에서 다루지 않는다. 또한 alpha diversity를 estimating하거나 comparing할 때 bias가 존재한다 Estimating (Sample richness, raw data): 일반적으로 사용되는 alpha diversity indices의 plug-in estimates는 true alpha diversity에 대해서 negatively biased되어 있다 (더 작은 값).

Study/Paper Summary 2021.05.14

[Article] Data normalization 방법으로 rarefying보다 SRS가 더 낫다?

내용 구성 마이크로바이옴 분석 시 몇몇 통계 기법이나 diversity index 계산은 sample size를 고려하지 않는다. 그래서 data normalization을 통해 sample size를 맞추는 것이 중요하다. Normalization에 유명한 방법으로는 내가 원하는 sample size가 될 때까지 replacement 없이 random하게 뽑는 rarefying이 있다. 하지만 이 논문에서는 그보다 scaling with ranked subsampling (SRS)가 있다고 주장한다. SRS는 rarefying보다 정확도(preservation of the original community structure)와 재현성(reproducibility of data normalization)..

Study/Paper Summary 2021.05.07

[Article] Resampling methods를 활용한 prediction assessment

정리 보통 데이터 사이즈가 크면 split sample, 데이터 사이즈가 작으면 10-fold cross validation을 사용한다. 이 논문을 통해 classifier를 만든다면 prediction assesssment에 왜 10-fold cross validation이 주로 사용되는지 알 수 있다 (추후 인용도 가능) Classifier: '데이터-라벨'의 쌍으로부터 생성 가능. 추후 새로운 데이터가 들어왔을 때 어떤 라벨일지 알아맞추는 것 Classifier 생성에는 크게 3가지 단계가 존재: 1) feature selection, 2) model selection, 3) prediction assessment. Feature selection은 어떤 유전자(feature)를 prediction..

Study/Paper Summary 2021.05.05

[Doodle] 온라인 회의 시간을 정할 때 사용할 수 있는 웹서비스 Doodle

온라인 미팅 스케줄을 잡을 때 Doodle이라는 tool을 이용해볼 수 있다. Free online meeting scheduling tool Doodle is the simplest way to schedule meetings with team members, colleagues, clients, partners and friends. Take back control of your calendar (and time) today! doodle.com 사용 방법 사용하는 방법은 굉장히 쉬운데, 먼저 + Create a Doodle 을 누른다. 1. 회의 정보 작성 회의 이름, 회의 방식, 추가적으로 필요한 정보 등을 작성한다. 2. 회의 시간 옵션 생성 가능한 회의 시간 선택지를 생성한다. 3. 투표 설정..

Study/Resource 2021.03.05

[Article] UNOISE 논문 (알고리즘, 특징)

내용 구성 Illumina denoisers는 두 단계로 구성됨. 1) Denoising, 2) Filtering of chimeric amplicons. Denoising은 high-abundance sequence와 유사한 low-abundance sequence는 error일 것이라는 전제를 바탕으로 한다. 이때 correct sequence와 error를 구분하는 threshold를 정하는 것이 주요 challenge이다. 여러 방법을 같이 쓰는 것이 하나만 쓰는 것보다 낫다고 이야기함. 알고리즘: Reads를 abundance를 기준으로 정렬함. Abundance가 높은 read를 centroid sequence로 잡고, 다른 read들과 abundance를 비교하여 그 비율이 특정 thresh..

Study/Paper Summary 2021.02.17

[Article] ASV method 중 하나인 Deblur에 대한 참조 논문

내용 구성 Deblur 알고리즘: 1) Sequence를 abundance로 sorting. 2) Predicted error-derived reads의 수를 제외. 3) 수가 0 이하로 되는 sequence는 output에서 제외. 4) UCHIME으로 chimeras 제거. 참고 Deblur의 인용수는 425회, UNOISE의 인용수는 410회 (2021-02-15) github.com/biocore/deblur Illumina 장비의 경우 nucleotide 당 error rate가 0.1% 정도이다. AmpliconNoise라는 denoising method도 존재 (for pyrosequencing) Deblur는 DADA2 및 UNOISE2와 다르게 각 샘플에 대하여 독립적으로 작동한다 (fu..

Study/Paper Summary 2021.02.15

[Article] 마이크로바이옴 샘플 상온 보관 시 적용할 수 있는 방법

내용 구성 Gammaproteobacteria (class) 등에 속하는 세균(IBD와도 연관)은 상온에서 더 쉽게 자라며, 상온 보관한 샘플에 영향을 미칠 수 있다. 위 논문에서는 상온에서 쉽게 자라는 세균의 리스트를 구하고, 그 세균을 profile에서 제외시킴으로써 correcting할 수 있다고 한다 (몇몇만 제거해도 충분하다고 설명함). 급냉동한 샘플과 상온에 두었던 샘플을 비교하여 세균 리스트를 구하였다. Type 1과 type 2 error 사이의 balance가 중요함 (Noisy data와 loss of data). 어느 정도로 candidate blooming bacterial taxa를 제거할지는 추가 분석하여 구해볼 수 있다: 어느 정도 제거했을 때 나이에 따라 다양성이 구분되는지 ..

Study/Paper Summary 2021.02.15
728x90
반응형