MACHINE-LEARNING MODEL FOR DETECTING A BUBBLE WITHIN A NUCLEOTIDE-SAMPLE SLIDE FOR SEQUENCING

Methods, systems, and non-transitory computer readable media are disclosed for accurately and efficiently detect when bubbles impact nucleic-acid-sequencing runs based on data captured during (or derived from) base calls during sequencing runs. In particular, in one or more embodiments, the disclose...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: PARNABY, Gavin Derek, LANGLOIS, Robert Ezra, YUAN, Junqi, GROS, Thomas, WESTERBERG, Brandon Tyler, HAHM, Mark David
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods, systems, and non-transitory computer readable media are disclosed for accurately and efficiently detect when bubbles impact nucleic-acid-sequencing runs based on data captured during (or derived from) base calls during sequencing runs. In particular, in one or more embodiments, the disclosed systems receive data identifying nucleobase calls and data identifying quality metrics for the nucleobase calls during sequencing cycles. Based on particular nucleobase calls and threshold markers for the quality metrics, the disclosed system utilizes a machine-learning-model to detect a presence of a bubble in a nucleotide-sample slide. Beyond simply detecting the presence of a bubble, the disclosed system can also classify different detected bubbles, such as air bubbles, oil bubbles, or ghost bubbles, or other outputs during sequencing. By utilizing call data and quality metrics, the disclose system can use readily available sequencing data in a platform-agnostic approach to detect bubbles using a uniquely trained machine-learning model. Des procédés, des systèmes et des supports lisibles par ordinateur non transitoires sont divulgués pour détecter avec précision et efficacement le moment où des bulles impactent des cycles de séquençage d'acides nucléiques basés sur des données capturées pendant (ou dérivées) des appels de base pendant des cycles de séquençage. En particulier, dans un ou plusieurs modes de réalisation, les systèmes divulgués reçoivent des données identifiant des appels de nucléobase et des données identifiant des métriques de qualité pour les appels de nucléobase pendant des cycles de séquençage. Sur la base d'appels de nucléobase particuliers et de marqueurs de seuil pour les mesures de qualité, le système divulgué utilise un modèle d'apprentissage automatique pour la détection de la présence d'une bulle dans une lame d'échantillon de nucléotide. Au-delà de la détection simple de la présence d'une bulle, le système divulgué peut également classifier différentes bulles détectées, telles que des bulles d'air, des bulles d'huile ou des bulles fantômes, ou d'autres sorties pendant le séquençage. En utilisant des données d'appel et des mesures de qualité, le système divulgué peut utiliser des données de séquençage facilement disponibles dans une approche agnostique de plateforme pour la détection des bulles à l'aide d'un modèle d'apprentissage automatique à entraînement unique.