SYSTEMS AND METHODS FOR ITERATIVE AND SCALABLE POPULATION-SCALE VARIANT ANALYSIS
An iterative process may be implemented for incrementally aggregating available batches of sample data with previously available batches to perform sequencing analysis. Genomic variant call files associated with one or more samples may be received in batches from sequencing devices and aggregated fo...
Gespeichert in:
Hauptverfasser: | , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | An iterative process may be implemented for incrementally aggregating available batches of sample data with previously available batches to perform sequencing analysis. Genomic variant call files associated with one or more samples may be received in batches from sequencing devices and aggregated for performing sequencing analysis. The aggregated genomic variant call files may be used to generate cohort files and census files that comprise summary information related to the genomic variant call files in each batch. The census data in census files may be aggregated into a global census file that includes summary genome variant data. Multi-sample variant call files may be generated based on the global census file, cohort files, and census files. The genomic variant call files may be processed using parallel processing at multiple compute nodes. The files may be further compressed and overlapping data may be efficiently stored in buffer positions.
Un processus itératif peut être mis en œuvre pour agréger de manière incrémentielle des lots disponibles de données d'échantillon avec des lots précédemment disponibles afin d'effectuer une analyse de séquençage. Des fichiers d'appel de variant génomique associés à un ou à plusieurs échantillons peuvent être reçus en lots à partir de dispositifs de séquençage et agrégés pour effectuer une analyse de séquençage. Les fichiers d'appel de variant génomique agrégés peuvent être utilisés pour générer des fichiers de cohorte et des fichiers de recensement qui comprennent des informations de résumé associées aux fichiers d'appel de variant génomique dans chaque lot. Les données de recensement dans des fichiers de recensement peuvent être agrégées en un fichier de recensement global qui comprend des données de variant de génome récapitulatif. Des fichiers d'appel variants multi-échantillons peuvent être générés sur la base du fichier de recensement global, des fichiers de cohorte et des fichiers de recensement. Les fichiers d'appel de variant génomique peuvent être traités à l'aide d'un traitement parallèle au niveau de multiples nœuds de calcul. Les fichiers peuvent en outre être compressés et des données se chevauchant peuvent être stockées efficacement dans des positions de tampon. |
---|