METHODS AND SYSTEMS FOR PROTEIN ENGINEERING AND PRODUCTION

The present invention provides methods for producing a protein having one or more desired properties, the method comprising: (a) a library design step, (b) a library testing step; and (c) a learning step, in which the sequence variants are each assigned a fitness score based at least in part on the...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: RICKERBY, Harrison Frederick, PUTINTSEVA, Ekaterina Victorovna, COZENS, Christopher, FIELD, James Edward John
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:The present invention provides methods for producing a protein having one or more desired properties, the method comprising: (a) a library design step, (b) a library testing step; and (c) a learning step, in which the sequence variants are each assigned a fitness score based at least in part on the result of the library testing step, and a machine learning algorithm uses the fitness score of each of the sequence variants to train a model to predict the fitness score for new sequence variants, and wherein the machine learning model trained in step (c) is used to design a new library of sequence variants. The present invention also provides a system for producing a protein having one or more desired properties, said system adapted to implement the method of the invention. La présente invention concerne des procédés de production d'une protéine ayant une ou plusieurs propriétés souhaitées, le procédé comprenant : (A) une étape de conception de bibliothèque, (b) une étape de test de bibliothèque, et (c) une étape d'apprentissage, dans laquelle une note de condition physique est attribuée à chacune des variantes de séquence en se basant au moins en partie sur le résultat de l'étape de test de bibliothèque, et un algorithme d'apprentissage automatique utilise la note de condition physique de chacune des variantes de séquence pour entraîner un modèle afin de prédire la note de condition physique pour de nouvelles variantes de séquence. Le modèle d'apprentissage automatique entraîné à l'étape (c) est utilisé pour concevoir une nouvelle bibliothèque de variantes de séquence. La présente invention concerne également un système de production d'une protéine ayant une ou plusieurs propriétés souhaitées, ledit système étant conçu pour mettre en œuvre le procédé selon l'invention.