SCHEMA-AWARE ENCODING OF NATURAL LANGUAGE

Methods, systems and computer program products are provided for performing schema-aware encoding of natural language (NL). NL may be encoded into a schema-aware encodings to improve (e.g., SQL) queries generated by (e.g., SQL) database query generators from the NL. Improved queries may improve the a...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: CAREVIC, Filip, VUJIC, Ivan, NIKOLIC, Neda Pistinjat, ASHFAQ, Atabak, BOSKOVIC, Uros
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods, systems and computer program products are provided for performing schema-aware encoding of natural language (NL). NL may be encoded into a schema-aware encodings to improve (e.g., SQL) queries generated by (e.g., SQL) database query generators from the NL. Improved queries may improve the accuracy of query execution results generated by a (e.g., SQL) database server, which may reduce resource consumption and improve customer satisfaction by avoiding repetitious searches. Encoded NL may include the NL and/or an indication of the task (e.g., convert encoded NL into an SQL query) along with a DB schema. A DB schema may include full or partial lists of DB table names, DB column names, and interrelationships between DB entities, such as foreign key relationships between tables. NL may be encoded (e.g., in an order) optimized for a type of NL model, e.g., a text to SQL autoregressive language model. L'invention concerne des procédés, des systèmes et des produits programmes d'ordinateur pour effectuer un codage sensible au schéma d'un langage naturel (NL). Un langage NL peut être codé dans des codages sensibles au schéma pour améliorer des interrogations (par exemple, un langage SQL) générées par des générateurs d'interrogation de base de données (par exemple, un langage SQL) à partir du langage NL. Des interrogations améliorées peuvent améliorer la précision de résultats d'exécution d'interrogation générés par un serveur de base de données (par exemple, un langage SQL), ce qui peut réduire la consommation de ressources et améliorer la satisfaction du client en évitant des recherches répétitives. Le langage NL codé peut comprendre le langage NL et/ou une indication de la tâche (par exemple, convertir le langage NL codé en une interrogation de langage SQL) conjointement avec un schéma de DB. Un schéma de DB peut comprendre des listes complètes ou partielles de noms de table de DB, de noms de colonne DB et d'interrelations entre des entités DB, telles que des relations de clé étrangère entre des tables. Un langage NL peut être codé (par exemple, dans un ordre) optimisé pour un type de modèle de langage NL, par exemple, un modèle de langage autorégressif texte-langage SQL.