SYSTEM AND METHOD FOR ANALYZING, STORING, AND SHARING GENOMIC DATA USING BLOCKCHAIN

A computerized method of compressing genomic sequencing data, the method has the steps of: aligning the genomic sequencing data with reference sequencing data; obtaining one or more difference read sequences, each of the one or more difference read sequences being a read sequence of the genomic sequ...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SINGH, Raja Balraj, ALKHAFAJI, Afnan, BHINDER, Sidharth Singh, KAPOOR, Anmol
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A computerized method of compressing genomic sequencing data, the method has the steps of: aligning the genomic sequencing data with reference sequencing data; obtaining one or more difference read sequences, each of the one or more difference read sequences being a read sequence of the genomic sequencing data that is different to a corresponding read sequence of the reference sequencing data; and obtain compressed genomic sequencing data by compressing the one or more difference read sequences using a statistical compression method or using an assembly method with a probabilistic data structure. In some embodiments, the method further has a step of assembling a plurality of reads to form the reference data. In some embodiments, the method further has a step of storing compressed genomic data in a blockchain. Procédé informatisé de compression de données de séquençage génomique, le procédé comprend les étapes consistant à : aligner les données de séquençage génomique avec des données de séquençage de référence ; obtenir une ou plusieurs séquences de lecture de différence, chacune de la ou des séquences de lecture de différence étant une séquence de lecture des données de séquençage génomique qui est différente d'une séquence de lecture correspondante des données de séquençage de référence ; et obtenir des données de séquençage génomique compressées par compression de la ou des séquences de lecture de différence à l'aide d'un procédé de compression statistique ou à l'aide d'un procédé d'assemblage avec une structure de données probabiliste. Selon certains modes de réalisation, le procédé comporte en outre une étape consistant à assembler une pluralité de lectures pour former les données de référence. Selon certains modes de réalisation, le procédé comporte en outre une étape consistant à stocker les données génomiques compressées dans une chaîne de blocs.