METHODS AND COMPOSITIONS THAT UTILIZE TRANSCRIPTOME SEQUENCING DATA IN MACHINE LEARNING-BASED CLASSIFICATION

Provided herein are methods and systems for producing a modified biological dataset by flagging or removing a nucleic acid sequence from the biological dataset that is assigned a noise-call to produce the modified biological dataset. The noise-call may be based on comparing a gene expression level,...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: HU, Zhanzhi, WALSH, P., Sean, KENNEDY, Giulia, C, KIM, Su, Yeon, HUANG, Jing, TRAVERS, Kevin
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Provided herein are methods and systems for producing a modified biological dataset by flagging or removing a nucleic acid sequence from the biological dataset that is assigned a noise-call to produce the modified biological dataset. The noise-call may be based on comparing a gene expression level, sequence information, or a combination thereof with a nucleic acid sequence of a control sample. L'invention concerne des procédés et des systèmes de production d'un ensemble de données biologiques modifié par balisage ou élimination d'une séquence d'acide nucléique de l'ensemble de données biologiques auquel est affecté un bruit-appel pour générer l'ensemble de données biologiques modifié. Le bruit-appel peut se baser sur la comparaison d'un niveau d'expression génique, des informations de séquence, ou d'une combinaison des deux avec la séquence d'acide nucléique d'un échantillon témoin.