MACHINE LEARNING FOR DESIGNING ANTIBODIES AND NANOBODIES IN-SILICO

A computer-implemented method for generating a set of candidate variant amino acid sequences of an antibody, a nanobody, or a fragment thereof, having binding ability to a target protein, may comprise: (a) obtaining a set of seed amino acid sequences; and (b) processing the set of seed amino acid se...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: CHAVOSH, Alireza, HEMMATIAN, Zahra
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A computer-implemented method for generating a set of candidate variant amino acid sequences of an antibody, a nanobody, or a fragment thereof, having binding ability to a target protein, may comprise: (a) obtaining a set of seed amino acid sequences; and (b) processing the set of seed amino acid sequences using a first trained machine learning algorithm to generate the set of candidate amino acid sequences, wherein the first trained machine learning algorithm is trained with first training data comprising a set of training amino acid sequences for the target protein, wherein the first trained machine learning algorithm is further trained through a transfer learning method using a second trained machine learning algorithm, wherein the second trained machine learning algorithm is trained with second training data comprising a set of training amino acid sequences for a second target protein, wherein the second target protein is different from the target protein. L'invention concerne un procédé mis en œuvre par ordinateur pour générer un ensemble de séquences d'acides aminés variants candidats d'un anticorps, d'un nanocorps ou d'un fragment de celui-ci, ayant une capacité de liaison à une protéine cible, pouvant consister : (a) à obtenir un ensemble de séquences initiales d'acides aminés; et (b) à traiter l'ensemble de séquences initiales d'acides aminés à l'aide d'un premier algorithme d'apprentissage machine formé pour générer l'ensemble de séquences d'acides aminés candidates, le premier algorithme d'apprentissage machine formé étant formé à l'aide de premières données d'apprentissage comprenant un ensemble de séquences d'acides aminés d'apprentissage pour la protéine cible, le premier algorithme d'apprentissage de machine formé étant en outre formé par l'intermédiaire d'un procédé d'apprentissage de transfert à l'aide d'un second algorithme d'apprentissage de machine formé, le second algorithme d'apprentissage machine formé étant formé à l'aide de secondes données d'apprentissage comprenant un ensemble de séquences d'acides aminés d'apprentissage pour une seconde protéine cible, la seconde protéine cible étant différente de la protéine cible.