METHODS AND SYSTEMS FOR THE ANALYSIS OF BIOLOGICAL SEQUENCE DATA

Nucleic acid sequence determination is a method whereby peaks in data traces representing the detection of labeled nucleotides are classified as either noise or specific nucleotides. Embodiments are described herein that formulate this classification as a graph theory problem whereby graph edges enc...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: LABRENZ, JAMES, SORENSON, JON M, GEHMAN, CURTIS
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Nucleic acid sequence determination is a method whereby peaks in data traces representing the detection of labeled nucleotides are classified as either noise or specific nucleotides. Embodiments are described herein that formulate this classification as a graph theory problem whereby graph edges encode peak characteristics. The graph can then be traversed to find the shortest path. Various embodiments formulate the graph in such a way as to minimize computational time. In various cases it is desirable that such classification allow for the possibility of mixed bases in the nucleotide sequence. Embodiments are described herein that address the classification of mixed-bases. Embodiments are also described that detail methods and systems for processing the data in order to make the classification step robust and reliable. Selon la présente invention, la détermination de séquences d'acides nucléiques est une méthode, dans laquelle des crêtes dans des traces de variables représentant la détection de nucléotides étiquetés sont classifiées en tant que bruit ou nucléotides spécifiques. Des modes de réalisation de l'invention ont trait à cette classification en fonction du problème de la théorie des graphes, selon lequel des bords de graphes codent des caractéristiques de crêtes. Ledit graphe peut alors être traversé de manière à trouver la voie la plus courte. Divers modes de réalisation abordent le graphe de manière à minimiser le temps de calcul. Dans des cas variés, il est souhaitable qu'une telle classification permette la possibilité de bases mélangées dans la séquence de nucléotides. Des modes de réalisation ont pour objet la classification de bases mélangées et d'autres modes de réalisation détaillent des systèmes et des procédés de traitement des données, en vue de faire de l'étape de classification une étape solide et fiable.