DATA RELATIONSHIP MODEL

A model (100) is used to represent a set of structured data objects that include elements at defined positions. The model includes distributions of vectors (110), each distribution corresponding to particular positions in the respective structured data objects, each of the vectors comprising values...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KARP, PETER, LINCOLN, PATRICK, DENIS, SONMEZ, KEMAL, TOLL, LAWRENCE, R
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A model (100) is used to represent a set of structured data objects that include elements at defined positions. The model includes distributions of vectors (110), each distribution corresponding to particular positions in the respective structured data objects, each of the vectors comprising values for the particular positions; and comparing a given set of structured data objects to the model to determine a likelihood that the given set is represented by the model. At least some of the distributions of the model differ such that different states of matching are indicated. Distributions of the model can indicate: dissimilarity between the structured data objects at defined positions; similarity between the structured data objects at defined positions; or similarity to a reference structure data object at defined positions. The model can be used to analyze and compare biopolymer sequences (150), such as protein and nucleic acid sequences. On utilise un modèle pour représenter un ensemble d'objets de données structurés qui comprennent des éléments à des positions définies. Ce modèle comprend des distributions de vecteurs, chaque distribution correspondant à des positions particulières dans ces objets de données structurés, chacun de ces vecteurs comprenant des valeurs pour ces positions particulières. Ce modèle consiste à comparer un ensemble donné d'objets de données structurés au modèle de façon à déterminer une vraisemblance pour que cet ensemble donné soit représenté par le modèle. Au moins quelques une des distributions de ce modèle diffèrent de sorte que des états différents de mise en correspondance sont indiqués. Des distributions de ce modèle peuvent indiquer: des dissimilarités entre les objets de données structurés à des positions définies, des similarités entre les objets de données structurés à des positions définies, ou des similarités avec un objet de données structuré de référence à des positions définies. On peut utiliser ce modèle pour analyser et comparer des séquences de biopolymères, telles que des séquences d'acides nucléiques ou de protéines.