LEAN PARSING: A NATURAL LANGUAGE PROCESSING SYSTEM AND METHOD FOR PARSING DOMAIN-SPECIFIC LANGUAGES
A method and system parses natural language in a unique way, determining important words pertaining to a text corpus of a particular genre, such as tax preparation. Sentences extracted from instructions or forms pertaining to tax preparation, for example are parsed to determine word groups forming v...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A method and system parses natural language in a unique way, determining important words pertaining to a text corpus of a particular genre, such as tax preparation. Sentences extracted from instructions or forms pertaining to tax preparation, for example are parsed to determine word groups forming various parts of speech, and then are processed to exclude words on an exclusion list and word groups that don't meet predetermined criteria. From the resulting data, synonyms are replaced with a common functional operator and the resulting sentence text is analyzed against predetermined patterns to determine one or more functions to be used in a document preparation system.
L'invention concerne un procédé et un système qui analysent le langage naturel d'une manière unique, déterminant des mots importants appartenant à un corpus de textes d'un genre particulier, tel que de préparation de déclarations fiscales. Les phrases extraites d'instructions ou de formulaires se rapportant à la préparation de déclarations fiscales sont analysées, par exemple pour déterminer des groupes de mots formant diverses parties du discours, puis sont traitées pour exclure des mots sur une liste d'exclusion et des groupes de mots qui ne satisfont pas à des critères prédéfinis. À partir des données ainsi obtenues, les synonymes sont remplacés par un opérateur fonctionnel commun et le texte de phrase ainsi obtenu est analysé par rapport à des modèles prédéfinis afin de déterminer une ou plusieurs fonctions à utiliser dans un système de préparation de documents. |
---|