COMPUTER-BASED SYSTEM AND METHOD FOR FINDING RULES OF LAW IN TEXT
A system and method for binary classification of text units such as sentences, paragraphs and documents as either a rule of law (ROL) or not a rule of law ( &tilde& ROL) (206). During a training phase (202) of the system and method of the present invention, an initialized knowledge base and...
Gespeichert in:
Hauptverfasser: | , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A system and method for binary classification of text units such as sentences, paragraphs and documents as either a rule of law (ROL) or not a rule of law ( &tilde& ROL) (206). During a training phase (202) of the system and method of the present invention, an initialized knowledge base and labeled or pre-classified sentences are used to build a trained knowledge base. The trained knowledge base contains an equation (404), a threshold (405), and a plurality of statistical values called Z values (502). When inputting text documents for classification, a Z value is generated for each term or token in the input text. The Z values are input to the equation which calculates a score for each sentence. Each calculated score is compared to the threshold to classify each sentence as either ROL or &tilde& ROL.
L'invention concerne un système et un procédé de classification binaire d'unités de texte telles que des phrases, des paragraphes et des documents comme règle de droit (ROL) ou non-règle de droit (< &tilde& >ROL) (206). Lors d'une phase de formation (202) du système et du procédé de l'invention, une base de connaissances initialisée et des phrases étiquetées ou préclassées sont utilisées pour construire une base de connaissances formée. La base de connaissances formée contient une équation (404), un seuil (405) et une pluralité de valeurs statistiques appelées valeurs Z (502). Lors de l'introduction de documents textuels en vue d'une classification, une valeur Z est produite pour chaque terme ou unité lexicale du texte d'entrée. Les valeurs Z sont introduites dans l'équation, qui permet de calculer un résultat pour chaque phrase. Chaque résultat calculé est comparé au seuil pour classer chaque phrase comme ROL ou < &tilde& >ROL. |
---|