MACHINE-LEARNING MODELS FOR DETECTING AND ADJUSTING VALUES FOR NUCLEOTIDE METHYLATION LEVELS

This disclosure describes methods, non-transitory computer readable media, and systems that can use a machine-learning to determine factors or scores indicating an error level with which a given methylation assay detects methylation of cytosine bases. For instance, the disclosed systems use a machin...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ALMASI, Sepideh, EBERLE, Michael, SHULTZABERGER, Sarah E, MANZO, Andrea, NORBERG, Steven, DOLZHENKO, Egor, MATHONET, Pascale, GUERRERO, Luis Fernando Camarillo, BROWN, Colin, ROHRBACK, Suzanne
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:This disclosure describes methods, non-transitory computer readable media, and systems that can use a machine-learning to determine factors or scores indicating an error level with which a given methylation assay detects methylation of cytosine bases. For instance, the disclosed systems use a machine-learning model to generate a bias score indicating a degree to which a given methylation assay errs in detecting cytosine methylation when specific sequence contexts surround such cytosines compared to other sequence contexts. The machine-learning model may take various forms of models, including a decision-tree model, a neural network, or a combination of a decision-tree model and a neural network. In some cases, the disclosed system combines or uses bias scores from multiple machine-learning models to generate a consensus bias score. La présente invention concerne des procédés, des supports lisibles par ordinateur non transitoires et des systèmes qui peuvent utiliser un apprentissage automatique pour déterminer des facteurs ou des scores indiquant un niveau d'erreur avec lequel un dosage de méthylation donné détecte la méthylation de bases cytosine. Par exemple, les systèmes selon l'invention utilisent un modèle d'apprentissage automatique pour générer un score de biais indiquant un degré auquel un dosage de méthylation donné commet une erreur lors de la détection d'une méthylation de cytosine lorsque des contextes de séquence spécifiques entourent de telles cytosines par rapport à d'autres contextes de séquence. Le modèle d'apprentissage automatique peut prendre diverses formes de modèles, y compris un modèle d'arbre de décision, un réseau neuronal ou une combinaison d'un modèle d'arbre de décision et d'un réseau neuronal. Dans certains cas, le système selon l'invention combine ou utilise des scores de biais provenant de multiples modèles d'apprentissage automatique pour générer un score de biais de consensus.