SYSTEMS AND METHODS FOR CORRELATED ERROR EVENT MITIGATION FOR VARIANT CALLING

Methods, systems, and apparatus, including computer programs for improving the accuracy of a variant call by accounting for indications of correlated error events. In one aspect, a method may include actions of accessing a pileup of sequence reads aligned to a first region of a reference genome, obt...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: OJARD, ERIC JON
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods, systems, and apparatus, including computer programs for improving the accuracy of a variant call by accounting for indications of correlated error events. In one aspect, a method may include actions of accessing a pileup of sequence reads aligned to a first region of a reference genome, obtaining information describing one or more characteristics of each of the plurality of reads of the pileup, providing one or more inputs to a probability model describing the one or more characteristics of the plurality of reads of the pileup, wherein the probability model is configured to determine a score, for each hypothesis of one or more hypotheses selected based on the one or more inputs, that indicates whether each hypothesis is true, obtaining output information for each of the one or more hypotheses, and determining, based on the obtained output information, a likelihood that a true variant exists at the first position. L'invention concerne également des procédés, des systèmes et un appareil, y compris des programmes informatiques, permettant d'améliorer la précision d'une variante d'appel en tenant compte des indications d'événements d'erreurs corrélés. Selon un aspect, un procédé peut comprendre des actions consistant à : accéder à un empilement de lectures de séquence alignées sur une première zone d'un génome de référence; obtenir des informations décrivant une ou plusieurs caractéristiques de chaque empilement de la pluralité de lectures de l'empilement; fournir une ou plusieurs entrées dans un modèle de probabilité décrivant la ou les caractéristiques de la pluralité de lectures de l'empilement, le modèle de probabilité étant configuré pour déterminer un score, pour chaque hypothèse d'une ou de plusieurs hypothèses sélectionnées d'après l'entrée ou les entrées, qui indique si chaque hypothèse est vraie; obtenir des informations de sortie pour chacune des hypothèses; et déterminer, d'après les informations de sortie obtenues, une probabilité qu'une variante vraie existe dans la première position.