반응형
Ⅰ. Sequence Generation : 염기서열 생성
⇨ NGS 장비에서 DNA fragment(조각)의 염기 서열을 식별
- 짧은 DNA fragment로부터 식별된 염기 서열은 리드 단위로 생성되고, 염기서열 정보는 FASTQ 파일로 생성됨.
Ⅱ. Sequence Alignment
⇨ Reference genome 과 비교하여 DNA fragment의 원 위치를 추정
- 각 리드의 reference genome 내 위치 & alignment 결과가 SAM or BAM 파일로 저장됨.
- SAM or BAM 파일을 이용해서 '모든 genome 상의 위치에 대해 align 된 리드의 개수 계산
- 특정 유전자 or 영역에 대해 Depth of coverage 계산
Ⅲ. Variant Calling
⇨ Reference genome과 생성된 서열 중 차이가 있는 부분을 검출.
- 검출된 변이는 VCF 파일로 저장
Ⅳ. Variant filtering & Variant Annotation
⇨ 변이 검출 과정에서 false positive로 생각되는 변이를 제거
⇨ 각 변이에 대한 관련 정보를 추가.
반응형
'Bio' 카테고리의 다른 글
miRNA (1) | 2022.12.31 |
---|---|
Pangenome analysis (0) | 2022.12.18 |