Study/Paper Summary

[Research] Short metagenomic reads을 유전자 데이터베이스에 매핑할 때 유의할 점 (Functional profiling)

2021. 8. 27. 10:48

정리

  • Human fecal metagenome samples에 존재하는 short read를 gene이나 protein DB에 매핑하여 어떤 기능을 할 수 있는지 알아낼 수 있다 (이때 mapping 전에 assemble을 먼저 진행하면 abundant members 쪽으로 bias가 생길 수 있으니 지양).
  • 이때 short read가 어떤 기능을 하는지 찾을 때 sequencing 전후 결정이 큰 영향을 미칠 수 있다 -> 이를 정리
  • DIAMOND를 사용하여 매핑 시 (functional profiling), 1) longer reads + 큰 sequencing depth (PE150 format), 2) stricter e-value thresholds (180-250 bp일 때), 3) custom database (연구 목적에 한정적인 DB)의 경우 가장 좋은 성능을 보였다.
  • Longer reads는 paired end read가 overlap이 있을 때 merging하여 얻을 수도 있고, overlap이 없다면 각각 독립적으로 매핑하는 것도 방법이 될 수 있다.

 

Reference

  • Treiber, Michelle L., et al. "Pre-and post-sequencing recommendations for functional annotation of human fecal metagenomes." BMC bioinformatics 21.1 (2020): 1-15.

 

 

728x90
반응형