BLIND DENOISING OF SEQUENCING DATA

A method for blind denoising of sequencing data may include receiving a plurality of read sequences associated with a scaffold sequence. Each read sequence may be a repeat of the scaffold sequence, at least one of which is a noisy read sequence that fails to match the scaffold sequence. A sequence d...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KELLY, Ryan, PARK, Ji Won, LEE, Jae Hyeon, NG, Nathan Hoyen, CHO, Kyunghyun
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A method for blind denoising of sequencing data may include receiving a plurality of read sequences associated with a scaffold sequence. Each read sequence may be a repeat of the scaffold sequence, at least one of which is a noisy read sequence that fails to match the scaffold sequence. A sequence denoising model may be applied to encode the plurality of read sequences, and generate, based on an encoding of the plurality of read sequences, a denoised scaffold sequence that corresponds to the scaffold sequence. The denoised scaffold sequence may be generated absent the scaffold sequence. A molecule associated with the scaffold sequence may be analyzed based on the denoised scaffold sequence. Related systems and computer program products are also provided. La présente invention concerne un procédé de débruitage aveugle de données de séquençage, lequel procédé peut consister à recevoir une pluralité de séquences de lecture associées à une séquence d'échafaudage. Chaque séquence de lecture peut être une répétition de la séquence d'échafaudage, dont au moins une est une séquence de lecture bruyante qui ne parvient pas à correspondre à la séquence d'échafaudage. Un modèle de débruitage de séquence peut être appliqué pour coder la pluralité de séquences de lecture, et générer, sur la base d'un codage de la pluralité de séquences de lecture, une séquence d'échafaudage débruitée qui correspond à la séquence d'échafaudage. La séquence d'échafaudage débruitée peut être générée en l'absence de la séquence d'échafaudage. Une molécule associée à la séquence d'échafaudage peut être analysée sur la base de la séquence d'échafaudage débruitée. La présente invention concerne également des systèmes et des produits programmes d'ordinateur associés.