MACHINE LEARNING PIPELINE USING DNA-ENCODED LIBRARY SELECTIONS
Embodiments of the disclosure involve training machine learned models using DNA-encoded library experimental data outputs and for deploying the trained machine learned models for conducting a virtual compound screen, for performing a hit selection and analysis, or for predicting binding affinities b...
Gespeichert in:
Hauptverfasser: | , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Embodiments of the disclosure involve training machine learned models using DNA-encoded library experimental data outputs and for deploying the trained machine learned models for conducting a virtual compound screen, for performing a hit selection and analysis, or for predicting binding affinities between compounds and targets. Machine learned models are trained using one or more augmentations that selectively expand molecular representations of a training dataset. Furthermore, machine learned models are trained to account for confounding covariates, thereby improving the machine learned models' abilities to conduct a virtual screen, perform a hit selection, and to predict binding affinities.
Des modes de réalisation de l'invention consistent à entraîner des modèles par apprentissage au moyen de sorties de données expérimentales de chimiothèque codée par ADN (DEL), et à déployer les modèles entraînés par apprentissage automatique pour réaliser un criblage virtuel de composés, sélectionner et analyser les résultats ou prédire des affinités de liaison entre des composés et des cibles. Des modèles sont entraînés au moyen d'au moins une augmentation qui étend de façon sélective les représentations moléculaires d'un ensemble de données d'apprentissage. En outre, lesdits modèles sont entraînés à prendre en compte les covariables confondantes, ce qui améliore la capacité des modèles entraînés à effectuer un criblage virtuel, à sélectionner les résultats et à prédire des affinités de liaison. |
---|