PREDICTING PROTEIN STRUCTURES BY SHARING INFORMATION BETWEEN MULTIPLE SEQUENCE ALIGNMENTS AND PAIR EMBEDDINGS

Methods, systems, and apparatus, including computer programs encoded on a computer storage medium, for predicting a structure of a protein comprising one or more chains. In one aspect, a method comprises: obtaining an initial multiple sequence alignment (MSA) representation; obtaining a respective i...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: PRITZEL, Alexander, EVANS, Richard Andrew, BATES, Russell James, JUMPER, John, FIGURNOV, Mikhail, KOHL, Simon, RONNEBERGER, Olaf
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods, systems, and apparatus, including computer programs encoded on a computer storage medium, for predicting a structure of a protein comprising one or more chains. In one aspect, a method comprises: obtaining an initial multiple sequence alignment (MSA) representation; obtaining a respective initial pair embedding for each pair of amino acids in the protein; processing an input comprising the initial MSA representation and the initial pair embeddings using an embedding neural network to generate an output that comprises a final MSA representation and a respective final pair embedding for each pair of amino acids in the protein; and determining a predicted structure of the protein using the final MSA representation, the final pair embeddings, or both. L'invention concerne des procédés, des systèmes et un appareil, dont des programmes informatiques codés sur un support de stockage informatique, pour prédire la structure d'une protéine comprenant une ou plusieurs chaînes. Selon un aspect, un procédé comprend les étapes consistant à : obtenir une représentation d'un alignement initial de plusieurs séquences (MSA); obtenir une paire initiale correspondante d'intégration pour chaque paire d'acides aminés dans la protéine; traiter une entrée comprenant la représentation MSA initiale et les intégrations de paires initiales à l'aide d'un réseau neuronal d'intégration pour générer une sortie qui comprend une représentation MSA finale et une intégration de paire finale correspondante pour chaque paire d'acides aminés dans la protéine; et déterminer une structure prédite de la protéine à l'aide de la représentation MSA finale, des intégrations de paires finales, ou des deux.