MACHINE LEARNING PIPELINE USING DNA-ENCODED LIBRARY SELECTIONS

Embodiments of the disclosure involve training machine learned models using DNA-encoded library experimental data outputs and for deploying the trained machine learned models for conducting a virtual compound screen, for performing a hit selection and analysis, or for predicting binding affinities b...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: DREIMAN, Gabriel, RIESSELMAN, Adam, RUGGIU, Fiorella, MA, Ralph, SULTAN, Mohammad Muneeb, LIU, Bowen
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator DREIMAN, Gabriel
RIESSELMAN, Adam
RUGGIU, Fiorella
MA, Ralph
SULTAN, Mohammad Muneeb
LIU, Bowen
description Embodiments of the disclosure involve training machine learned models using DNA-encoded library experimental data outputs and for deploying the trained machine learned models for conducting a virtual compound screen, for performing a hit selection and analysis, or for predicting binding affinities between compounds and targets. Machine learned models are trained using one or more augmentations that selectively expand molecular representations of a training dataset. Furthermore, machine learned models are trained to account for confounding covariates, thereby improving the machine learned models' abilities to conduct a virtual screen, perform a hit selection, and to predict binding affinities. Des modes de réalisation de l'invention consistent à entraîner des modèles par apprentissage au moyen de sorties de données expérimentales de chimiothèque codée par ADN (DEL), et à déployer les modèles entraînés par apprentissage automatique pour réaliser un criblage virtuel de composés, sélectionner et analyser les résultats ou prédire des affinités de liaison entre des composés et des cibles. Des modèles sont entraînés au moyen d'au moins une augmentation qui étend de façon sélective les représentations moléculaires d'un ensemble de données d'apprentissage. En outre, lesdits modèles sont entraînés à prendre en compte les covariables confondantes, ce qui améliore la capacité des modèles entraînés à effectuer un criblage virtuel, à sélectionner les résultats et à prédire des affinités de liaison.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2023070106A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2023070106A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2023070106A13</originalsourceid><addsrcrecordid>eNrjZLDzdXT28PRzVfBxdQzy8_RzVwjwDHD1AYmEBoO4Ln6Ouq5-zv4uri4KPp5OQY5BkQrBrj6uziGe_n7BPAysaYk5xam8UJqbQdnNNcTZQze1ID8-tbggMTk1L7UkPtzfyMDI2MDcwNDAzNHQmDhVAPDbKuA</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>MACHINE LEARNING PIPELINE USING DNA-ENCODED LIBRARY SELECTIONS</title><source>esp@cenet</source><creator>DREIMAN, Gabriel ; RIESSELMAN, Adam ; RUGGIU, Fiorella ; MA, Ralph ; SULTAN, Mohammad Muneeb ; LIU, Bowen</creator><creatorcontrib>DREIMAN, Gabriel ; RIESSELMAN, Adam ; RUGGIU, Fiorella ; MA, Ralph ; SULTAN, Mohammad Muneeb ; LIU, Bowen</creatorcontrib><description>Embodiments of the disclosure involve training machine learned models using DNA-encoded library experimental data outputs and for deploying the trained machine learned models for conducting a virtual compound screen, for performing a hit selection and analysis, or for predicting binding affinities between compounds and targets. Machine learned models are trained using one or more augmentations that selectively expand molecular representations of a training dataset. Furthermore, machine learned models are trained to account for confounding covariates, thereby improving the machine learned models' abilities to conduct a virtual screen, perform a hit selection, and to predict binding affinities. Des modes de réalisation de l'invention consistent à entraîner des modèles par apprentissage au moyen de sorties de données expérimentales de chimiothèque codée par ADN (DEL), et à déployer les modèles entraînés par apprentissage automatique pour réaliser un criblage virtuel de composés, sélectionner et analyser les résultats ou prédire des affinités de liaison entre des composés et des cibles. Des modèles sont entraînés au moyen d'au moins une augmentation qui étend de façon sélective les représentations moléculaires d'un ensemble de données d'apprentissage. En outre, lesdits modèles sont entraînés à prendre en compte les covariables confondantes, ce qui améliore la capacité des modèles entraînés à effectuer un criblage virtuel, à sélectionner les résultats et à prédire des affinités de liaison.</description><language>eng ; fre</language><subject>BEER ; BIOCHEMISTRY ; CALCULATING ; CHEMISTRY ; COMPOSITIONS THEREOF ; COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS ; COMPUTING ; COUNTING ; CULTURE MEDIA ; ENZYMOLOGY ; INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTEDFOR SPECIFIC APPLICATION FIELDS ; METALLURGY ; MICROBIOLOGY ; MICROORGANISMS OR ENZYMES ; MUTATION OR GENETIC ENGINEERING ; PHYSICS ; PROPAGATING, PRESERVING OR MAINTAINING MICROORGANISMS ; SPIRITS ; VINEGAR ; WINE</subject><creationdate>2023</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20230427&amp;DB=EPODOC&amp;CC=WO&amp;NR=2023070106A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,780,885,25564,76547</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20230427&amp;DB=EPODOC&amp;CC=WO&amp;NR=2023070106A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>DREIMAN, Gabriel</creatorcontrib><creatorcontrib>RIESSELMAN, Adam</creatorcontrib><creatorcontrib>RUGGIU, Fiorella</creatorcontrib><creatorcontrib>MA, Ralph</creatorcontrib><creatorcontrib>SULTAN, Mohammad Muneeb</creatorcontrib><creatorcontrib>LIU, Bowen</creatorcontrib><title>MACHINE LEARNING PIPELINE USING DNA-ENCODED LIBRARY SELECTIONS</title><description>Embodiments of the disclosure involve training machine learned models using DNA-encoded library experimental data outputs and for deploying the trained machine learned models for conducting a virtual compound screen, for performing a hit selection and analysis, or for predicting binding affinities between compounds and targets. Machine learned models are trained using one or more augmentations that selectively expand molecular representations of a training dataset. Furthermore, machine learned models are trained to account for confounding covariates, thereby improving the machine learned models' abilities to conduct a virtual screen, perform a hit selection, and to predict binding affinities. Des modes de réalisation de l'invention consistent à entraîner des modèles par apprentissage au moyen de sorties de données expérimentales de chimiothèque codée par ADN (DEL), et à déployer les modèles entraînés par apprentissage automatique pour réaliser un criblage virtuel de composés, sélectionner et analyser les résultats ou prédire des affinités de liaison entre des composés et des cibles. Des modèles sont entraînés au moyen d'au moins une augmentation qui étend de façon sélective les représentations moléculaires d'un ensemble de données d'apprentissage. En outre, lesdits modèles sont entraînés à prendre en compte les covariables confondantes, ce qui améliore la capacité des modèles entraînés à effectuer un criblage virtuel, à sélectionner les résultats et à prédire des affinités de liaison.</description><subject>BEER</subject><subject>BIOCHEMISTRY</subject><subject>CALCULATING</subject><subject>CHEMISTRY</subject><subject>COMPOSITIONS THEREOF</subject><subject>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>CULTURE MEDIA</subject><subject>ENZYMOLOGY</subject><subject>INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTEDFOR SPECIFIC APPLICATION FIELDS</subject><subject>METALLURGY</subject><subject>MICROBIOLOGY</subject><subject>MICROORGANISMS OR ENZYMES</subject><subject>MUTATION OR GENETIC ENGINEERING</subject><subject>PHYSICS</subject><subject>PROPAGATING, PRESERVING OR MAINTAINING MICROORGANISMS</subject><subject>SPIRITS</subject><subject>VINEGAR</subject><subject>WINE</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2023</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZLDzdXT28PRzVfBxdQzy8_RzVwjwDHD1AYmEBoO4Ln6Ouq5-zv4uri4KPp5OQY5BkQrBrj6uziGe_n7BPAysaYk5xam8UJqbQdnNNcTZQze1ID8-tbggMTk1L7UkPtzfyMDI2MDcwNDAzNHQmDhVAPDbKuA</recordid><startdate>20230427</startdate><enddate>20230427</enddate><creator>DREIMAN, Gabriel</creator><creator>RIESSELMAN, Adam</creator><creator>RUGGIU, Fiorella</creator><creator>MA, Ralph</creator><creator>SULTAN, Mohammad Muneeb</creator><creator>LIU, Bowen</creator><scope>EVB</scope></search><sort><creationdate>20230427</creationdate><title>MACHINE LEARNING PIPELINE USING DNA-ENCODED LIBRARY SELECTIONS</title><author>DREIMAN, Gabriel ; RIESSELMAN, Adam ; RUGGIU, Fiorella ; MA, Ralph ; SULTAN, Mohammad Muneeb ; LIU, Bowen</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2023070106A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2023</creationdate><topic>BEER</topic><topic>BIOCHEMISTRY</topic><topic>CALCULATING</topic><topic>CHEMISTRY</topic><topic>COMPOSITIONS THEREOF</topic><topic>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>CULTURE MEDIA</topic><topic>ENZYMOLOGY</topic><topic>INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTEDFOR SPECIFIC APPLICATION FIELDS</topic><topic>METALLURGY</topic><topic>MICROBIOLOGY</topic><topic>MICROORGANISMS OR ENZYMES</topic><topic>MUTATION OR GENETIC ENGINEERING</topic><topic>PHYSICS</topic><topic>PROPAGATING, PRESERVING OR MAINTAINING MICROORGANISMS</topic><topic>SPIRITS</topic><topic>VINEGAR</topic><topic>WINE</topic><toplevel>online_resources</toplevel><creatorcontrib>DREIMAN, Gabriel</creatorcontrib><creatorcontrib>RIESSELMAN, Adam</creatorcontrib><creatorcontrib>RUGGIU, Fiorella</creatorcontrib><creatorcontrib>MA, Ralph</creatorcontrib><creatorcontrib>SULTAN, Mohammad Muneeb</creatorcontrib><creatorcontrib>LIU, Bowen</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>DREIMAN, Gabriel</au><au>RIESSELMAN, Adam</au><au>RUGGIU, Fiorella</au><au>MA, Ralph</au><au>SULTAN, Mohammad Muneeb</au><au>LIU, Bowen</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>MACHINE LEARNING PIPELINE USING DNA-ENCODED LIBRARY SELECTIONS</title><date>2023-04-27</date><risdate>2023</risdate><abstract>Embodiments of the disclosure involve training machine learned models using DNA-encoded library experimental data outputs and for deploying the trained machine learned models for conducting a virtual compound screen, for performing a hit selection and analysis, or for predicting binding affinities between compounds and targets. Machine learned models are trained using one or more augmentations that selectively expand molecular representations of a training dataset. Furthermore, machine learned models are trained to account for confounding covariates, thereby improving the machine learned models' abilities to conduct a virtual screen, perform a hit selection, and to predict binding affinities. Des modes de réalisation de l'invention consistent à entraîner des modèles par apprentissage au moyen de sorties de données expérimentales de chimiothèque codée par ADN (DEL), et à déployer les modèles entraînés par apprentissage automatique pour réaliser un criblage virtuel de composés, sélectionner et analyser les résultats ou prédire des affinités de liaison entre des composés et des cibles. Des modèles sont entraînés au moyen d'au moins une augmentation qui étend de façon sélective les représentations moléculaires d'un ensemble de données d'apprentissage. En outre, lesdits modèles sont entraînés à prendre en compte les covariables confondantes, ce qui améliore la capacité des modèles entraînés à effectuer un criblage virtuel, à sélectionner les résultats et à prédire des affinités de liaison.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2023070106A1
source esp@cenet
subjects BEER
BIOCHEMISTRY
CALCULATING
CHEMISTRY
COMPOSITIONS THEREOF
COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
COMPUTING
COUNTING
CULTURE MEDIA
ENZYMOLOGY
INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTEDFOR SPECIFIC APPLICATION FIELDS
METALLURGY
MICROBIOLOGY
MICROORGANISMS OR ENZYMES
MUTATION OR GENETIC ENGINEERING
PHYSICS
PROPAGATING, PRESERVING OR MAINTAINING MICROORGANISMS
SPIRITS
VINEGAR
WINE
title MACHINE LEARNING PIPELINE USING DNA-ENCODED LIBRARY SELECTIONS
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2024-12-24T22%3A28%3A15IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=DREIMAN,%20Gabriel&rft.date=2023-04-27&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2023070106A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true