Next generation sequencing (NGS)는 크게 Single-end sequencing, Paired-end sequencing, Circular consensus sequencing (CCS)로 구분할 수 있다.
- Single-end sequencing (Roche 454, Ion Torrents): DNA fragment의 한쪽 끝만 sequencing한다.
- Paired-end sequencing (Illumina): DNA fragment의 양쪽 끝을 sequencing한다. 이때 각 paried read 사이의 거리를 알고 있기 때문에 repetitive regions에 대하여 더 정확하게 alignment를 할 수 있다 (1). 한편, 아래 그림의 경우에는 read가 겹치는 overlap이 없지만, overlap이 있는 경우도 있다. 그런 경우에는 pandaseq, vsearch 등의 프로그램을 통해 하나로 합칠 수 있다.
Paired-end sequencing의 결과로 두 개의 FASTQ 파일을 얻을 수 있다 (예를 들어, SRS1234_1.fastq와 SRS1234_2.fastq). 각각이 forward read 및 reverse read를 나타낸다. Sequence를 확인해보면 모두 5' -> 3'로 되어있는 것을 확인할 수 있었다. 즉, 두 reads를 합칠 때는 reverse reads를 reverse compliment시킨 후 overlap 되는 부분을 합치면 된다. 또한 각각의 read 앞쪽에 primer가 붙어있을 수 있다.
- Circular consensus sequencing (Pacific Biosciences)
Reference
- https://www.illumina.com/science/technology/next-generation-sequencing/plan-experiments/paired-end-vs-single-read.html
- https://www.pacb.com/smrt-science/smrt-sequencing/hifi-reads-for-highly-accurate-long-read-sequencing/
728x90
반응형
'Bioinformatics > etc.' 카테고리의 다른 글
[생물정보학] Sequencing의 종류 (0) | 2021.10.04 |
---|---|
[용어 설명] Sequence masking이란? | Soft masking & Hard masking (0) | 2021.10.02 |
[용어 설명] SNP (single-nucleotide polymorphism)와 SNV (single-nucleotide variant) 차이 (0) | 2021.08.02 |
[illumina] Sequence library의 구성 (primer, index, oligo) (0) | 2021.07.30 |
[용어 설명] Multiomics (다중체학)의 개념: Genomics, Transcriptomics, Proteomics, Metabolomics (0) | 2021.07.01 |