GENERATION OF PROTEIN SEQUENCES USING MACHINE LEARNING TECHNIQUES

Amino acid sequences of antibodies can be generated using a generative adversarial network that includes a first generating component that generates amino acid sequences of antibody light chains and a second generating component that generates amino acid sequences of antibody heavy chains. Amino aci...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: TAYLOR, JOHN ALEX, KET, RANDAL ROBERT, SHAVER, JEREMY MARTIN, CLARK, RUTILIO H, AMIMEUR, TILELI
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Amino acid sequences of antibodies can be generated using a generative adversarial network that includes a first generating component that generates amino acid sequences of antibody light chains and a second generating component that generates amino acid sequences of antibody heavy chains. Amino acid sequences of antibodies can be produced by combining the respective amino acid sequences produced by the first generating component and the second generating component. The training of the first generating component and the second generating component can proceed at different rates. Additionally, the antibody amino acids produced by combining amino acid sequences from the first generating component and the second generating component may be evaluated according to complentarity-determining regions of the antibody amino acid sequences. Training datasets may be produced using amino acid sequences that correspond to antibodies have particular binding affinities with respect to molecules, such as binding affinity with major histocompatibility complex (MHC) molecules. Des séquences d'acides aminés d'anticorps peuvent être générées à l'aide d'un réseau antagoniste génératif comprenant un premier composant de génération qui génère des séquences d'acides aminés de chaînes légères d'anticorps et d'un second composant de génération qui génère des séquences d'acides aminés de chaînes lourdes d'anticorps. Des séquences d'acides aminés d'anticorps peuvent être produites par une combinaison des séquences d'acides aminés respectives produites par le premier composant de génération et par le second composant de génération. Les apprentissages du premier composant de génération et du second composant de génération peuvent se dérouler à des vitesses différentes. De plus, les acides aminés d'anticorps produits par une combinaison de séquences d'acides aminés provenant du premier composant de génération et du second composant de génération peuvent être évalués conformément à des régions déterminant la complémentarité des séquences d'acides aminés d'anticorps. Des ensembles de données d'apprentissage peuvent être produits à l'aide de séquences d'acides aminés qui correspondent à des anticorps ayant des affinités de liaison particulières par rapport à des molécules, telles que l'affinité de liaison avec des molécules de complexe majeur d'histocompatibilité (CMH).