VARIANT CALLER

Processes and systems for reading variants from a genome sample relative to a reference genomic sequence are provided. An exemplary process includes collecting a set reads and generating a k-mer graph from the reads. For example, the k-mer graph can be constructed to represent all possible substring...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: GIBIANSKY, ANDREW, LEONIDOVICH, HAQUE, IMRAN, SAEEDUL, ROBERTSON, ALEXANDER, DE JONG, MAGUIRE, JARED, ROBERT
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator GIBIANSKY, ANDREW, LEONIDOVICH
HAQUE, IMRAN, SAEEDUL
ROBERTSON, ALEXANDER, DE JONG
MAGUIRE, JARED, ROBERT
description Processes and systems for reading variants from a genome sample relative to a reference genomic sequence are provided. An exemplary process includes collecting a set reads and generating a k-mer graph from the reads. For example, the k-mer graph can be constructed to represent all possible substrings of the collected reads. The k-mer graph may be reduced to a contiguous graph, and a set of possible haplotypes generated from the contiguous graph. The process may further generate, the error table providing a filter for common sequencer errors. The process may then generate a set of diplotypes based on the set of haplotypes and the generated error table and score the set of diplotypes to identify variants from the reference genome. Scoring the diplotypes may include determining a posterior probability for each of the diplotypes, with the highest scoring diplotype(s) reported as the result. L'invention concerne des procédés et des systèmes permettant de lire des variants dans un échantillon génomique par rapport à une séquence génomique de référence. Un procédé donné à titre d'exemple consiste à recueillir un ensemble de lectures et générer un graphe K-mer à partir des lectures. Par exemple, le graphe K-mer peut être conçu pour représenter toutes les sous-chaînes possibles des lectures recueillies. Le graphe K-mer peut être réduit à un graphe contigu, et un ensemble d'haplotypes possibles générés à partir du graphe contigu. Le procédé peut en outre générer la table d'erreurs fournissant un filtre pour des erreurs de séquenceur communes. Le procédé peut alors générer un ensemble de diplotypes sur la base de l'ensemble d'haplotypes et de la table d'erreurs générée et évaluer l'ensemble de diplotypes pour identifier des variants à partir du génome de référence. L'évaluation des diplotypes peut consister à déterminer une probabilité postérieure pour chaque diplotype, le(s) diplotype(s) ayant l'évaluation la plus élevée étant notifié(s) comme résultat.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2016061396A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2016061396A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2016061396A13</originalsourceid><addsrcrecordid>eNrjZOALcwzydPQLUXB29PFxDeJhYE1LzClO5YXS3AzKbq4hzh66qQX58anFBYnJqXmpJfHh_kYGhmYGZobGlmaOhsbEqQIANtsd0Q</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>VARIANT CALLER</title><source>esp@cenet</source><creator>GIBIANSKY, ANDREW, LEONIDOVICH ; HAQUE, IMRAN, SAEEDUL ; ROBERTSON, ALEXANDER, DE JONG ; MAGUIRE, JARED, ROBERT</creator><creatorcontrib>GIBIANSKY, ANDREW, LEONIDOVICH ; HAQUE, IMRAN, SAEEDUL ; ROBERTSON, ALEXANDER, DE JONG ; MAGUIRE, JARED, ROBERT</creatorcontrib><description>Processes and systems for reading variants from a genome sample relative to a reference genomic sequence are provided. An exemplary process includes collecting a set reads and generating a k-mer graph from the reads. For example, the k-mer graph can be constructed to represent all possible substrings of the collected reads. The k-mer graph may be reduced to a contiguous graph, and a set of possible haplotypes generated from the contiguous graph. The process may further generate, the error table providing a filter for common sequencer errors. The process may then generate a set of diplotypes based on the set of haplotypes and the generated error table and score the set of diplotypes to identify variants from the reference genome. Scoring the diplotypes may include determining a posterior probability for each of the diplotypes, with the highest scoring diplotype(s) reported as the result. L'invention concerne des procédés et des systèmes permettant de lire des variants dans un échantillon génomique par rapport à une séquence génomique de référence. Un procédé donné à titre d'exemple consiste à recueillir un ensemble de lectures et générer un graphe K-mer à partir des lectures. Par exemple, le graphe K-mer peut être conçu pour représenter toutes les sous-chaînes possibles des lectures recueillies. Le graphe K-mer peut être réduit à un graphe contigu, et un ensemble d'haplotypes possibles générés à partir du graphe contigu. Le procédé peut en outre générer la table d'erreurs fournissant un filtre pour des erreurs de séquenceur communes. Le procédé peut alors générer un ensemble de diplotypes sur la base de l'ensemble d'haplotypes et de la table d'erreurs générée et évaluer l'ensemble de diplotypes pour identifier des variants à partir du génome de référence. L'évaluation des diplotypes peut consister à déterminer une probabilité postérieure pour chaque diplotype, le(s) diplotype(s) ayant l'évaluation la plus élevée étant notifié(s) comme résultat.</description><language>eng ; fre</language><subject>CHEMISTRY ; COMBINATORIAL CHEMISTRY ; INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTEDFOR SPECIFIC APPLICATION FIELDS ; INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIRCHEMICAL OR PHYSICAL PROPERTIES ; LIBRARIES, e.g. CHEMICAL LIBRARIES, IN SILICOLIBRARIES ; MEASURING ; METALLURGY ; PHYSICS ; TESTING</subject><creationdate>2016</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20160421&amp;DB=EPODOC&amp;CC=WO&amp;NR=2016061396A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,780,885,25564,76547</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20160421&amp;DB=EPODOC&amp;CC=WO&amp;NR=2016061396A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>GIBIANSKY, ANDREW, LEONIDOVICH</creatorcontrib><creatorcontrib>HAQUE, IMRAN, SAEEDUL</creatorcontrib><creatorcontrib>ROBERTSON, ALEXANDER, DE JONG</creatorcontrib><creatorcontrib>MAGUIRE, JARED, ROBERT</creatorcontrib><title>VARIANT CALLER</title><description>Processes and systems for reading variants from a genome sample relative to a reference genomic sequence are provided. An exemplary process includes collecting a set reads and generating a k-mer graph from the reads. For example, the k-mer graph can be constructed to represent all possible substrings of the collected reads. The k-mer graph may be reduced to a contiguous graph, and a set of possible haplotypes generated from the contiguous graph. The process may further generate, the error table providing a filter for common sequencer errors. The process may then generate a set of diplotypes based on the set of haplotypes and the generated error table and score the set of diplotypes to identify variants from the reference genome. Scoring the diplotypes may include determining a posterior probability for each of the diplotypes, with the highest scoring diplotype(s) reported as the result. L'invention concerne des procédés et des systèmes permettant de lire des variants dans un échantillon génomique par rapport à une séquence génomique de référence. Un procédé donné à titre d'exemple consiste à recueillir un ensemble de lectures et générer un graphe K-mer à partir des lectures. Par exemple, le graphe K-mer peut être conçu pour représenter toutes les sous-chaînes possibles des lectures recueillies. Le graphe K-mer peut être réduit à un graphe contigu, et un ensemble d'haplotypes possibles générés à partir du graphe contigu. Le procédé peut en outre générer la table d'erreurs fournissant un filtre pour des erreurs de séquenceur communes. Le procédé peut alors générer un ensemble de diplotypes sur la base de l'ensemble d'haplotypes et de la table d'erreurs générée et évaluer l'ensemble de diplotypes pour identifier des variants à partir du génome de référence. L'évaluation des diplotypes peut consister à déterminer une probabilité postérieure pour chaque diplotype, le(s) diplotype(s) ayant l'évaluation la plus élevée étant notifié(s) comme résultat.</description><subject>CHEMISTRY</subject><subject>COMBINATORIAL CHEMISTRY</subject><subject>INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTEDFOR SPECIFIC APPLICATION FIELDS</subject><subject>INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIRCHEMICAL OR PHYSICAL PROPERTIES</subject><subject>LIBRARIES, e.g. CHEMICAL LIBRARIES, IN SILICOLIBRARIES</subject><subject>MEASURING</subject><subject>METALLURGY</subject><subject>PHYSICS</subject><subject>TESTING</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2016</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZOALcwzydPQLUXB29PFxDeJhYE1LzClO5YXS3AzKbq4hzh66qQX58anFBYnJqXmpJfHh_kYGhmYGZobGlmaOhsbEqQIANtsd0Q</recordid><startdate>20160421</startdate><enddate>20160421</enddate><creator>GIBIANSKY, ANDREW, LEONIDOVICH</creator><creator>HAQUE, IMRAN, SAEEDUL</creator><creator>ROBERTSON, ALEXANDER, DE JONG</creator><creator>MAGUIRE, JARED, ROBERT</creator><scope>EVB</scope></search><sort><creationdate>20160421</creationdate><title>VARIANT CALLER</title><author>GIBIANSKY, ANDREW, LEONIDOVICH ; HAQUE, IMRAN, SAEEDUL ; ROBERTSON, ALEXANDER, DE JONG ; MAGUIRE, JARED, ROBERT</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2016061396A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2016</creationdate><topic>CHEMISTRY</topic><topic>COMBINATORIAL CHEMISTRY</topic><topic>INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTEDFOR SPECIFIC APPLICATION FIELDS</topic><topic>INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIRCHEMICAL OR PHYSICAL PROPERTIES</topic><topic>LIBRARIES, e.g. CHEMICAL LIBRARIES, IN SILICOLIBRARIES</topic><topic>MEASURING</topic><topic>METALLURGY</topic><topic>PHYSICS</topic><topic>TESTING</topic><toplevel>online_resources</toplevel><creatorcontrib>GIBIANSKY, ANDREW, LEONIDOVICH</creatorcontrib><creatorcontrib>HAQUE, IMRAN, SAEEDUL</creatorcontrib><creatorcontrib>ROBERTSON, ALEXANDER, DE JONG</creatorcontrib><creatorcontrib>MAGUIRE, JARED, ROBERT</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>GIBIANSKY, ANDREW, LEONIDOVICH</au><au>HAQUE, IMRAN, SAEEDUL</au><au>ROBERTSON, ALEXANDER, DE JONG</au><au>MAGUIRE, JARED, ROBERT</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>VARIANT CALLER</title><date>2016-04-21</date><risdate>2016</risdate><abstract>Processes and systems for reading variants from a genome sample relative to a reference genomic sequence are provided. An exemplary process includes collecting a set reads and generating a k-mer graph from the reads. For example, the k-mer graph can be constructed to represent all possible substrings of the collected reads. The k-mer graph may be reduced to a contiguous graph, and a set of possible haplotypes generated from the contiguous graph. The process may further generate, the error table providing a filter for common sequencer errors. The process may then generate a set of diplotypes based on the set of haplotypes and the generated error table and score the set of diplotypes to identify variants from the reference genome. Scoring the diplotypes may include determining a posterior probability for each of the diplotypes, with the highest scoring diplotype(s) reported as the result. L'invention concerne des procédés et des systèmes permettant de lire des variants dans un échantillon génomique par rapport à une séquence génomique de référence. Un procédé donné à titre d'exemple consiste à recueillir un ensemble de lectures et générer un graphe K-mer à partir des lectures. Par exemple, le graphe K-mer peut être conçu pour représenter toutes les sous-chaînes possibles des lectures recueillies. Le graphe K-mer peut être réduit à un graphe contigu, et un ensemble d'haplotypes possibles générés à partir du graphe contigu. Le procédé peut en outre générer la table d'erreurs fournissant un filtre pour des erreurs de séquenceur communes. Le procédé peut alors générer un ensemble de diplotypes sur la base de l'ensemble d'haplotypes et de la table d'erreurs générée et évaluer l'ensemble de diplotypes pour identifier des variants à partir du génome de référence. L'évaluation des diplotypes peut consister à déterminer une probabilité postérieure pour chaque diplotype, le(s) diplotype(s) ayant l'évaluation la plus élevée étant notifié(s) comme résultat.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2016061396A1
source esp@cenet
subjects CHEMISTRY
COMBINATORIAL CHEMISTRY
INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTEDFOR SPECIFIC APPLICATION FIELDS
INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIRCHEMICAL OR PHYSICAL PROPERTIES
LIBRARIES, e.g. CHEMICAL LIBRARIES, IN SILICOLIBRARIES
MEASURING
METALLURGY
PHYSICS
TESTING
title VARIANT CALLER
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-06T10%3A01%3A41IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=GIBIANSKY,%20ANDREW,%20LEONIDOVICH&rft.date=2016-04-21&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2016061396A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true