Sequencing에서 가장 먼저 해야하는 일은 DNA나 RNA로부터 library를 제작하는 일이다. 마이크로바이옴 분야에서 amplicon sequencing library가 어떻게 제작되고 구성은 어떤지 확인하였다.
overhang adapter sequence(non-biological sequence)와 locus‐specific sequence(biological sequence, 341F/805R 등)가 연결된 primer를 PCR에 사용하여 원하는 부위를 증폭(amplification)하고 library를 만든다 (3).
제작된 Dual-indexed library의 구성은 다음과 같다 (1).
- Rd1 SP, Rd2 SP: Sequencing을 위한 sequencing primers의 binding site 1, 2에 해당한다.
- Index 1, Index 2: 3’, 5’ 쪽인지 구분할 수 있다.
- P5, P7: flow cell에 붙게 해주는 linker sequence이다 (region complementary to flow cell).
이들을 통칭해서 adaptor sequence라고 부른다. 이 library를 sequencing하여 우리가 관심 있는 DNA insert의 sequence를 알아낼 수 있다 (위 과정을 거쳐 sequencing이 완료되면 locus‐specific sequence는 raw data에서 확인 가능할 것으로 생각된다).
한편, sample barcodes라는 용어도 있다. 아래 그림과 같이 여러 개의 샘플을 합쳐서 (pooling samples) 한번에 분석하는 과정을 sample multiplexing (multiplex sequencing)이라고 한다. 여러 번 시퀀싱 기기를 돌릴 것을 한번만 하면 되기 때문에 비용과 시간이 절감된다. 이 과정에서 샘플들을 구분하기 위해 사용되는 것이 sample barcodes이다 (2).
Sample barcodes는 따로 있는 것이 아니라, 위의 index 1, index 2가 그 역할(sample identifiers)을 할 수 있다. Dual indexing strategy는 8 base의 Index 1 (i7)과 Index 2 (i5)을 사용하는 것으로, Index 1은 12개, Index 2는 8개의 서로 다른 sequence를 가질 수 있다. 그래서 최대 96개(12*8)의 샘플을 구분할 수 있다 (3).
Reference
- https://support.illumina.com/bulletins/2020/06/illumina-adapter-portfolio.html
- https://www.illumina.com/techniques/sequencing/ngs-library-prep/multiplexing.html
- https://support.illumina.com/documents/documentation/chemistry_documentation/16s/16s-metagenomic-library-prep-guide-15044223-b.pdf
'Bioinformatics > etc.' 카테고리의 다른 글
NGS의 구분: Single-end, Paired-end, CCS (0) | 2021.08.12 |
---|---|
[용어 설명] SNP (single-nucleotide polymorphism)와 SNV (single-nucleotide variant) 차이 (0) | 2021.08.02 |
[용어 설명] Multiomics (다중체학)의 개념: Genomics, Transcriptomics, Proteomics, Metabolomics (0) | 2021.07.01 |
[생물정보학] 생물정보학에서 주로 사용되는 파일 형식 (File format) (0) | 2021.06.13 |
[Phred Score] PHRED 33 encoded와 PHRED 64 encoded quality scores의 차이 (0) | 2021.03.05 |