COMPUTER-BASED SYSTEM AND METHOD FOR FINDING RULES OF LAW IN TEXT

A system and method for binary classification of text units such as sentences, paragraphs and documents as either a rule of law (ROL) or not a rule of law ( &tilde& ROL) (206). During a training phase (202) of the system and method of the present invention, an initialized knowledge base and...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: WILTSHIRE, JAMES, S., JR, HUMPHREY, TIMOTHY, L, MORELOCK, JOHN, T, AHMED, SALAHUDDIN, LU, X., ALLAN, COLLIAS, SPIRO, G
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator WILTSHIRE, JAMES, S., JR
HUMPHREY, TIMOTHY, L
MORELOCK, JOHN, T
AHMED, SALAHUDDIN
LU, X., ALLAN
COLLIAS, SPIRO, G
description A system and method for binary classification of text units such as sentences, paragraphs and documents as either a rule of law (ROL) or not a rule of law ( &tilde& ROL) (206). During a training phase (202) of the system and method of the present invention, an initialized knowledge base and labeled or pre-classified sentences are used to build a trained knowledge base. The trained knowledge base contains an equation (404), a threshold (405), and a plurality of statistical values called Z values (502). When inputting text documents for classification, a Z value is generated for each term or token in the input text. The Z values are input to the equation which calculates a score for each sentence. Each calculated score is compared to the threshold to classify each sentence as either ROL or &tilde& ROL. L'invention concerne un système et un procédé de classification binaire d'unités de texte telles que des phrases, des paragraphes et des documents comme règle de droit (ROL) ou non-règle de droit (< &tilde& >ROL) (206). Lors d'une phase de formation (202) du système et du procédé de l'invention, une base de connaissances initialisée et des phrases étiquetées ou préclassées sont utilisées pour construire une base de connaissances formée. La base de connaissances formée contient une équation (404), un seuil (405) et une pluralité de valeurs statistiques appelées valeurs Z (502). Lors de l'introduction de documents textuels en vue d'une classification, une valeur Z est produite pour chaque terme ou unité lexicale du texte d'entrée. Les valeurs Z sont introduites dans l'équation, qui permet de calculer un résultat pour chaque phrase. Chaque résultat calculé est comparé au seuil pour classer chaque phrase comme ROL ou < &tilde& >ROL.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO0193193A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO0193193A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO0193193A13</originalsourceid><addsrcrecordid>eNrjZHB09vcNCA1xDdJ1cgx2dVEIjgwOcfVVcPRzUfB1DfHwd1Fw8w9ScPP0c_H0c1cICvVxDVbwd1PwcQxX8PRTCHGNCOFhYE1LzClO5YXS3AwKbq4hzh66qQX58anFBYnJqXmpJfHh_gaGlsZA5GhoTIQSAG0WKmA</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>COMPUTER-BASED SYSTEM AND METHOD FOR FINDING RULES OF LAW IN TEXT</title><source>esp@cenet</source><creator>WILTSHIRE, JAMES, S., JR ; HUMPHREY, TIMOTHY, L ; MORELOCK, JOHN, T ; AHMED, SALAHUDDIN ; LU, X., ALLAN ; COLLIAS, SPIRO, G</creator><creatorcontrib>WILTSHIRE, JAMES, S., JR ; HUMPHREY, TIMOTHY, L ; MORELOCK, JOHN, T ; AHMED, SALAHUDDIN ; LU, X., ALLAN ; COLLIAS, SPIRO, G</creatorcontrib><description><![CDATA[A system and method for binary classification of text units such as sentences, paragraphs and documents as either a rule of law (ROL) or not a rule of law ( &tilde& ROL) (206). During a training phase (202) of the system and method of the present invention, an initialized knowledge base and labeled or pre-classified sentences are used to build a trained knowledge base. The trained knowledge base contains an equation (404), a threshold (405), and a plurality of statistical values called Z values (502). When inputting text documents for classification, a Z value is generated for each term or token in the input text. The Z values are input to the equation which calculates a score for each sentence. Each calculated score is compared to the threshold to classify each sentence as either ROL or &tilde& ROL. L'invention concerne un système et un procédé de classification binaire d'unités de texte telles que des phrases, des paragraphes et des documents comme règle de droit (ROL) ou non-règle de droit (< &tilde& >ROL) (206). Lors d'une phase de formation (202) du système et du procédé de l'invention, une base de connaissances initialisée et des phrases étiquetées ou préclassées sont utilisées pour construire une base de connaissances formée. La base de connaissances formée contient une équation (404), un seuil (405) et une pluralité de valeurs statistiques appelées valeurs Z (502). Lors de l'introduction de documents textuels en vue d'une classification, une valeur Z est produite pour chaque terme ou unité lexicale du texte d'entrée. Les valeurs Z sont introduites dans l'équation, qui permet de calculer un résultat pour chaque phrase. Chaque résultat calculé est comparé au seuil pour classer chaque phrase comme ROL ou < &tilde& >ROL.]]></description><edition>7</edition><language>eng ; fre</language><subject>CALCULATING ; COMPUTING ; COUNTING ; ELECTRIC DIGITAL DATA PROCESSING ; PHYSICS</subject><creationdate>2001</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20011206&amp;DB=EPODOC&amp;CC=WO&amp;NR=0193193A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25543,76293</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20011206&amp;DB=EPODOC&amp;CC=WO&amp;NR=0193193A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>WILTSHIRE, JAMES, S., JR</creatorcontrib><creatorcontrib>HUMPHREY, TIMOTHY, L</creatorcontrib><creatorcontrib>MORELOCK, JOHN, T</creatorcontrib><creatorcontrib>AHMED, SALAHUDDIN</creatorcontrib><creatorcontrib>LU, X., ALLAN</creatorcontrib><creatorcontrib>COLLIAS, SPIRO, G</creatorcontrib><title>COMPUTER-BASED SYSTEM AND METHOD FOR FINDING RULES OF LAW IN TEXT</title><description><![CDATA[A system and method for binary classification of text units such as sentences, paragraphs and documents as either a rule of law (ROL) or not a rule of law ( &tilde& ROL) (206). During a training phase (202) of the system and method of the present invention, an initialized knowledge base and labeled or pre-classified sentences are used to build a trained knowledge base. The trained knowledge base contains an equation (404), a threshold (405), and a plurality of statistical values called Z values (502). When inputting text documents for classification, a Z value is generated for each term or token in the input text. The Z values are input to the equation which calculates a score for each sentence. Each calculated score is compared to the threshold to classify each sentence as either ROL or &tilde& ROL. L'invention concerne un système et un procédé de classification binaire d'unités de texte telles que des phrases, des paragraphes et des documents comme règle de droit (ROL) ou non-règle de droit (< &tilde& >ROL) (206). Lors d'une phase de formation (202) du système et du procédé de l'invention, une base de connaissances initialisée et des phrases étiquetées ou préclassées sont utilisées pour construire une base de connaissances formée. La base de connaissances formée contient une équation (404), un seuil (405) et une pluralité de valeurs statistiques appelées valeurs Z (502). Lors de l'introduction de documents textuels en vue d'une classification, une valeur Z est produite pour chaque terme ou unité lexicale du texte d'entrée. Les valeurs Z sont introduites dans l'équation, qui permet de calculer un résultat pour chaque phrase. Chaque résultat calculé est comparé au seuil pour classer chaque phrase comme ROL ou < &tilde& >ROL.]]></description><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>PHYSICS</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2001</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZHB09vcNCA1xDdJ1cgx2dVEIjgwOcfVVcPRzUfB1DfHwd1Fw8w9ScPP0c_H0c1cICvVxDVbwd1PwcQxX8PRTCHGNCOFhYE1LzClO5YXS3AwKbq4hzh66qQX58anFBYnJqXmpJfHh_gaGlsZA5GhoTIQSAG0WKmA</recordid><startdate>20011206</startdate><enddate>20011206</enddate><creator>WILTSHIRE, JAMES, S., JR</creator><creator>HUMPHREY, TIMOTHY, L</creator><creator>MORELOCK, JOHN, T</creator><creator>AHMED, SALAHUDDIN</creator><creator>LU, X., ALLAN</creator><creator>COLLIAS, SPIRO, G</creator><scope>EVB</scope></search><sort><creationdate>20011206</creationdate><title>COMPUTER-BASED SYSTEM AND METHOD FOR FINDING RULES OF LAW IN TEXT</title><author>WILTSHIRE, JAMES, S., JR ; HUMPHREY, TIMOTHY, L ; MORELOCK, JOHN, T ; AHMED, SALAHUDDIN ; LU, X., ALLAN ; COLLIAS, SPIRO, G</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO0193193A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2001</creationdate><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>PHYSICS</topic><toplevel>online_resources</toplevel><creatorcontrib>WILTSHIRE, JAMES, S., JR</creatorcontrib><creatorcontrib>HUMPHREY, TIMOTHY, L</creatorcontrib><creatorcontrib>MORELOCK, JOHN, T</creatorcontrib><creatorcontrib>AHMED, SALAHUDDIN</creatorcontrib><creatorcontrib>LU, X., ALLAN</creatorcontrib><creatorcontrib>COLLIAS, SPIRO, G</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>WILTSHIRE, JAMES, S., JR</au><au>HUMPHREY, TIMOTHY, L</au><au>MORELOCK, JOHN, T</au><au>AHMED, SALAHUDDIN</au><au>LU, X., ALLAN</au><au>COLLIAS, SPIRO, G</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>COMPUTER-BASED SYSTEM AND METHOD FOR FINDING RULES OF LAW IN TEXT</title><date>2001-12-06</date><risdate>2001</risdate><abstract><![CDATA[A system and method for binary classification of text units such as sentences, paragraphs and documents as either a rule of law (ROL) or not a rule of law ( &tilde& ROL) (206). During a training phase (202) of the system and method of the present invention, an initialized knowledge base and labeled or pre-classified sentences are used to build a trained knowledge base. The trained knowledge base contains an equation (404), a threshold (405), and a plurality of statistical values called Z values (502). When inputting text documents for classification, a Z value is generated for each term or token in the input text. The Z values are input to the equation which calculates a score for each sentence. Each calculated score is compared to the threshold to classify each sentence as either ROL or &tilde& ROL. L'invention concerne un système et un procédé de classification binaire d'unités de texte telles que des phrases, des paragraphes et des documents comme règle de droit (ROL) ou non-règle de droit (< &tilde& >ROL) (206). Lors d'une phase de formation (202) du système et du procédé de l'invention, une base de connaissances initialisée et des phrases étiquetées ou préclassées sont utilisées pour construire une base de connaissances formée. La base de connaissances formée contient une équation (404), un seuil (405) et une pluralité de valeurs statistiques appelées valeurs Z (502). Lors de l'introduction de documents textuels en vue d'une classification, une valeur Z est produite pour chaque terme ou unité lexicale du texte d'entrée. Les valeurs Z sont introduites dans l'équation, qui permet de calculer un résultat pour chaque phrase. Chaque résultat calculé est comparé au seuil pour classer chaque phrase comme ROL ou < &tilde& >ROL.]]></abstract><edition>7</edition><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO0193193A1
source esp@cenet
subjects CALCULATING
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
PHYSICS
title COMPUTER-BASED SYSTEM AND METHOD FOR FINDING RULES OF LAW IN TEXT
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-25T11%3A57%3A38IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=WILTSHIRE,%20JAMES,%20S.,%20JR&rft.date=2001-12-06&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO0193193A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true