DEEP LEARNING BASED METHODS AND SYSTEMS FOR NUCLEIC ACID SEQUENCING

Methods and systems for determining a plurality of sequences of nucleic acid (e.g., DNA) molecules in a sequencing-by-synthesis process are provided. In one embodiment, the method comprises obtaining images of fluorescent signals obtained in a plurality of synthesis cycles. The images of fluorescent...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: YAN, Jichao, CHEN, Gengxin, LI, Shuwei, LU, Yuan, YAN, Mei, LUO, Shaobo, AO, Tianzhen
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods and systems for determining a plurality of sequences of nucleic acid (e.g., DNA) molecules in a sequencing-by-synthesis process are provided. In one embodiment, the method comprises obtaining images of fluorescent signals obtained in a plurality of synthesis cycles. The images of fluorescent signals are associated with a plurality of different fluorescence channels. The method further comprises preprocessing the images of fluorescent signals to obtain processed images. Based on a set of the processed images, the method further comprises detecting center positions of clusters of the fluorescent signals using a trained convolutional neural network (CNN) and extracting, based on the center positions of the clusters of fluorescent signals, features from the set of the processed images to generate feature embedding vectors. The method further comprises determining, in parallel, the plurality of sequences of DNA molecules using the extracted features based on a trained attention-based neural network. L'invention concerne des procédés et des systèmes pour déterminer une pluralité de séquences de molécules d'acide nucléique (par exemple, de l'ADN) dans un procédé de séquençage par synthèse. Dans un mode de réalisation, le procédé comprend l'obtention d'images de signaux fluorescents obtenus dans une pluralité de cycles de synthèse. Les images de signaux fluorescents sont associées à une pluralité de canaux de fluorescence différents. Le procédé comprend en outre le prétraitement des images de signaux fluorescents pour obtenir des images traitées. Sur la base d'un ensemble des images traitées, le procédé comprend en outre la détection de positions centrales de grappes des signaux fluorescents à l'aide d'un réseau de neurones à convolution (CNN) entraîné et l'extraction, sur la base des positions centrales des groupes de signaux fluorescents, de caractéristiques à partir de l'ensemble des images traitées pour générer des vecteurs d'incorporation de caractéristiques. Le procédé comprend en outre la détermination, en parallèle, de la pluralité de séquences de molécules d'ADN à l'aide des caractéristiques extraites sur la base d'un réseau de neurones basé sur l'attention entraîné.