ClinVar Indels의 유전체 변환을 위한 BCFtools/liftover의 적용
배경: 정렬을 통한 참조유전체 변환이 불가능한 경우에 대한 대안으로 리프트오버 도구가 제안되었다. 하지만 삽입/결실(insertions/deletions, indels) 변이의 경우, 유전체 어셈블리 간의 대립유전자차이가 정확하게 반영되지 못해 리프트오버 도구를 통한 변환에실패하는 경우가 종종 있다. 최근, 삽입/결실 변이의 유전체 변환을 지원하기 위해 BCFools/liftover가 개발되었다. 본 연구의 목적은 BCFools/liftover를 통한 삽입/결실 변이의 유전체 변환을 평가하는 것이다. 방법: Genome Refere...
Gespeichert in:
Veröffentlicht in: | Laboratory Medicine Online, 14(4) 2024, 14(4), , pp.376-381 |
---|---|
Hauptverfasser: | , , |
Format: | Artikel |
Sprache: | kor |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | 배경: 정렬을 통한 참조유전체 변환이 불가능한 경우에 대한 대안으로 리프트오버 도구가 제안되었다. 하지만 삽입/결실(insertions/deletions, indels) 변이의 경우, 유전체 어셈블리 간의 대립유전자차이가 정확하게 반영되지 못해 리프트오버 도구를 통한 변환에실패하는 경우가 종종 있다. 최근, 삽입/결실 변이의 유전체 변환을 지원하기 위해 BCFools/liftover가 개발되었다. 본 연구의 목적은 BCFools/liftover를 통한 삽입/결실 변이의 유전체 변환을 평가하는 것이다.
방법: Genome Reference Consortium human (GRCh) 37 및GRCh38 참조유전체에 정렬된 두 개의 variant call format (VCF) 파일을 ClinVar (https://ftp.ncbi.nlm.nih.gov/pub/clinvar/)에서 다운로드하였다. 총 23,419개의 ClinVar 삽입/결실 변이를 분석하였다.
참조유전체 GRCh37에서 GRCh38로 변환을 위한 리프트오버 도구로 BCFtools/liftover를 사용하였다. GRCh38에 정렬된 변이의 위치 및 대립유전자 정보를 기준으로 리프트오버된 변이의 변환 정확도를 평가하였다. 분석 대상 변이가 반복서열 영역에 위치하는지 확인하기 위해 UCSC의 RepeatMasker 트랙 정보를 활용하였다.
결과: GRCh38에 정렬된 변이 중 8개(0.03%)의 변이는 리프트오버된 변이 리스트에서 발견되지 않았다. Multiallele 변이(n=19)를 포함하여 리프트오버된 변이 20개의 명명(nomenclature)은 GRCh38 에 정렬된 변이의 명명과 일치하지 않았다. 반복서열 영역에 위치한 삽입/결실 변이의 대부분(99.82%)은 BCFtools/liftover을 통해성공적으로 변환되었다.
결론: 본 연구는 삽입/결실 변이의 유전체 변환을 위한 BCFtools/ liftover의 적용 가능성을 보여주었다. BCFtools/liftover는 반복서열 영역에 위치한 삽입/결실 변이의 유전체 변환에 정확하게 작동하였다. 하지만 삽입/결실 변이가 Multiallele 변이로 변환될 때BCFtools/liftover를 주의해서 사용해야 한다. Background: Liftover tools are one of the practical alternatives for genome conversion when realignment is not possible. However, these tools often cannot handle differences in alleles between assemblies in case of insertions/deletions (indels). Recently, BCFtools/liftover was developed to support the genome conversion of indels. As such, the aim of this study was to investigate the genome conversion of indels using BCFtools/liftover.
Methods: Two variant call format (VCF) files aligned to GRCh37 and GRCh38 were downloaded from ClinVar (https://ftp.ncbi.nlm.nih.gov/pub/ clinvar/). We used 23,419 ClinVar indels. BCFtools/liftover was used to convert genome coordinates from GRCh37 to GRCh38. The liftovered variants from GRCh37 to GRCh38 were compared with GRCh38-aligned variants. RepeatMasker track information from UCSC was used to determine whether the variants are located in repetitive sequence regions.
Results: Compared with the GRCh38-aligned variants, eight variants (0.03%) were not detected among the variants converted with the BCFtools/liftover. The nomenclature of the 20 liftovered variants, including multiallele variants (N=19), did not agree with that of the GRCh38- aligned variants. The tool successfully converted most of the indels located in repetitive sequence regions (99.82%).
Conclusions: This study demonstrated the applicability of BCFtools/liftover for the genome c |
---|---|
ISSN: | 2093-6338 |
DOI: | 10.47429/lmo.2024.14.4.376 |