MAPPING DOCUMENTS TO A RELATIONAL DATABASE TABLE WITH A DOCUMENT POSITION COLUMN

Architecture that maps document data (e.g., XML-extended markup language) into columns of one table, thereby avoiding schema normalization problems through special data storage. Moreover, an algorithm is described that can translate a query (e.g., in XPath (XML path language), a query language for n...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: CHEN, LIANG, CARLIN, PETER ALAN, RYS, MICHAEL, SHAMGUNOV, NIKITA, BERNSTEIN, PHILIP, A, TERWILLIGER, JAMES, F, TOMICAGAN
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Architecture that maps document data (e.g., XML-extended markup language) into columns of one table, thereby avoiding schema normalization problems through special data storage. Moreover, an algorithm is described that can translate a query (e.g., in XPath (XML path language), a query language for navigating through document elements and attributes of an XML document) into a relational algebra query of the document column representation. Based on the characteristics of the new mapping, query rewriting rules are provided that optimize the relational algebra query by minimizing the number of joins. The mapping of XML documents to the table is based on a summary structure and a hierarchical labeling scheme (e.g., ordpath) to enable a high-fidelity representation. Annotations are employed on the summary structure nodes to assist in mapping XML elements and attributes to the table. L'invention concerne une architecture qui mappe des données de documents (p. ex., langage XML) sur les colonnes d'une table, ce qui permet d'éviter des problèmes de normalisation de schémas au moyen d'un stockage de données spécial. De plus, l'invention décrit un algorithme qui permet de traduire une requête (p. ex., dans XPath (langage de chemin XML), un langage de requête permettant de naviguer dans les éléments et les attributs d'un document XML) en une requête d'algèbre relationnelle de la représentation de colonne de document. D'après les caractéristiques du nouveau mappage, des règles de réécriture de requête sont fournies pour optimiser la requête d'algèbre relationnelle en réduisant au minimum le nombre de jointures. Le mappage de documents XML sur la table s'appuie sur une structure de synthèse et un schéma d'étiquetage hiérarchique (par ex., ordpath) pour permettre une représentation haute fidélité. Des annotations sont utilisées sur les noeuds de la structure de synthèse pour aider au mappage des éléments et des attributs XML sur la table.