SYSTEM AND METHOD FOR CREATING AND MAINTAINING A DATABASE OF DISAMBIGUATED ENTITY MENTIONS AND RELATIONS FROM A CORPUS OF ELECTRONIC DOCUMENTS

Method and apparatus for creating an electronic database of disambiguated entity mentions and relations from a corpus of electronic documents. The invention automatically extracts from the corpus of electronic documents mentions about entities (e.g., references to people, organizations or places), p...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: HAWKS, MARSHALL, WELLS, WOYTOWITZ, MICHAEL, A
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator HAWKS, MARSHALL, WELLS
WOYTOWITZ, MICHAEL, A
description Method and apparatus for creating an electronic database of disambiguated entity mentions and relations from a corpus of electronic documents. The invention automatically extracts from the corpus of electronic documents mentions about entities (e.g., references to people, organizations or places), parses the entity mentions into "mention objects," and executes a series of grouping, comparison and hierarchical fuzzy object clustering algorithms to cluster together in an electronic database all of the mention objects referring to the same entity and all of the mention objects (e.g. "people") associated with each other by a relationship (e.g., "co-authors" or "family members"). The resulting electronic database of disambiguated entity mentions and relations, which may comprise, for example, an XML document, a relational database or hierarchical database, is structured to permit useful recordation, access, review and display of all of the mentions and relations associated with a particular entity or collection of entities. L'invention concerne un procédé et un appareil de création d'une base de données électronique de mentions d'entité désambiguïsées et de relations à partir d'un corpus de documents électroniques. L'invention extrait automatiquement du corpus de documents électroniques des mentions concernant des entités (par exemple des références à des personnes, à des organisations ou à des lieux), décompose les mentions d'entité en « objets de mention », et exécute une série d'algorithmes de groupement, de comparaison et de regroupement d'objets flous, hiérarchiques, afin de regrouper ensemble dans une base de données électronique tous les objets de mention se rapportant à la même entité et tous les objets de mention (par exemple des « personnes ») associés l'un à l'autre par une relation (par exemple « co-auteurs » ou « membres d'une même famille »). La base de données électronique résultante de mentions d'entité désambiguïsées et de relations, qui peut comprendre, par exemple, un document XML, une base de données relationnelle ou une base de données hiérarchique, est structurée pour permettre un enregistrement, un accès, un examen et un affichage utiles de toutes les mentions et relations associées à une entité ou à une collection d'entités particulière.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2012106008A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2012106008A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2012106008A13</originalsourceid><addsrcrecordid>eNqNjcEKwjAQRHvxIOo_LHgWUgXxuk02GrBZSbaIJykST6JC_Q6_2bT6AR6GYYZ9O-PiHU9RqAb0BmqSHRuwHEAHQnF---3ReckaMhgUrDASsAXjItaV2zYoZIC8ODnlN9nZx4ENtMdvsoHzDGgOhyb2MO1JS2DvNBjWTY_FaTG6trcuzX4-KeaWRO8W6fk4p-7ZXtI9vc5HXqpyWaq1UhssV_9dfQCIjkCI</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>SYSTEM AND METHOD FOR CREATING AND MAINTAINING A DATABASE OF DISAMBIGUATED ENTITY MENTIONS AND RELATIONS FROM A CORPUS OF ELECTRONIC DOCUMENTS</title><source>esp@cenet</source><creator>HAWKS, MARSHALL, WELLS ; WOYTOWITZ, MICHAEL, A</creator><creatorcontrib>HAWKS, MARSHALL, WELLS ; WOYTOWITZ, MICHAEL, A</creatorcontrib><description>Method and apparatus for creating an electronic database of disambiguated entity mentions and relations from a corpus of electronic documents. The invention automatically extracts from the corpus of electronic documents mentions about entities (e.g., references to people, organizations or places), parses the entity mentions into "mention objects," and executes a series of grouping, comparison and hierarchical fuzzy object clustering algorithms to cluster together in an electronic database all of the mention objects referring to the same entity and all of the mention objects (e.g. "people") associated with each other by a relationship (e.g., "co-authors" or "family members"). The resulting electronic database of disambiguated entity mentions and relations, which may comprise, for example, an XML document, a relational database or hierarchical database, is structured to permit useful recordation, access, review and display of all of the mentions and relations associated with a particular entity or collection of entities. L'invention concerne un procédé et un appareil de création d'une base de données électronique de mentions d'entité désambiguïsées et de relations à partir d'un corpus de documents électroniques. L'invention extrait automatiquement du corpus de documents électroniques des mentions concernant des entités (par exemple des références à des personnes, à des organisations ou à des lieux), décompose les mentions d'entité en « objets de mention », et exécute une série d'algorithmes de groupement, de comparaison et de regroupement d'objets flous, hiérarchiques, afin de regrouper ensemble dans une base de données électronique tous les objets de mention se rapportant à la même entité et tous les objets de mention (par exemple des « personnes ») associés l'un à l'autre par une relation (par exemple « co-auteurs » ou « membres d'une même famille »). La base de données électronique résultante de mentions d'entité désambiguïsées et de relations, qui peut comprendre, par exemple, un document XML, une base de données relationnelle ou une base de données hiérarchique, est structurée pour permettre un enregistrement, un accès, un examen et un affichage utiles de toutes les mentions et relations associées à une entité ou à une collection d'entités particulière.</description><language>eng ; fre</language><subject>CALCULATING ; COMPUTING ; COUNTING ; ELECTRIC DIGITAL DATA PROCESSING ; PHYSICS</subject><creationdate>2012</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20120809&amp;DB=EPODOC&amp;CC=WO&amp;NR=2012106008A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,780,885,25562,76317</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20120809&amp;DB=EPODOC&amp;CC=WO&amp;NR=2012106008A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>HAWKS, MARSHALL, WELLS</creatorcontrib><creatorcontrib>WOYTOWITZ, MICHAEL, A</creatorcontrib><title>SYSTEM AND METHOD FOR CREATING AND MAINTAINING A DATABASE OF DISAMBIGUATED ENTITY MENTIONS AND RELATIONS FROM A CORPUS OF ELECTRONIC DOCUMENTS</title><description>Method and apparatus for creating an electronic database of disambiguated entity mentions and relations from a corpus of electronic documents. The invention automatically extracts from the corpus of electronic documents mentions about entities (e.g., references to people, organizations or places), parses the entity mentions into "mention objects," and executes a series of grouping, comparison and hierarchical fuzzy object clustering algorithms to cluster together in an electronic database all of the mention objects referring to the same entity and all of the mention objects (e.g. "people") associated with each other by a relationship (e.g., "co-authors" or "family members"). The resulting electronic database of disambiguated entity mentions and relations, which may comprise, for example, an XML document, a relational database or hierarchical database, is structured to permit useful recordation, access, review and display of all of the mentions and relations associated with a particular entity or collection of entities. L'invention concerne un procédé et un appareil de création d'une base de données électronique de mentions d'entité désambiguïsées et de relations à partir d'un corpus de documents électroniques. L'invention extrait automatiquement du corpus de documents électroniques des mentions concernant des entités (par exemple des références à des personnes, à des organisations ou à des lieux), décompose les mentions d'entité en « objets de mention », et exécute une série d'algorithmes de groupement, de comparaison et de regroupement d'objets flous, hiérarchiques, afin de regrouper ensemble dans une base de données électronique tous les objets de mention se rapportant à la même entité et tous les objets de mention (par exemple des « personnes ») associés l'un à l'autre par une relation (par exemple « co-auteurs » ou « membres d'une même famille »). La base de données électronique résultante de mentions d'entité désambiguïsées et de relations, qui peut comprendre, par exemple, un document XML, une base de données relationnelle ou une base de données hiérarchique, est structurée pour permettre un enregistrement, un accès, un examen et un affichage utiles de toutes les mentions et relations associées à une entité ou à une collection d'entités particulière.</description><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>PHYSICS</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2012</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNqNjcEKwjAQRHvxIOo_LHgWUgXxuk02GrBZSbaIJykST6JC_Q6_2bT6AR6GYYZ9O-PiHU9RqAb0BmqSHRuwHEAHQnF---3ReckaMhgUrDASsAXjItaV2zYoZIC8ODnlN9nZx4ENtMdvsoHzDGgOhyb2MO1JS2DvNBjWTY_FaTG6trcuzX4-KeaWRO8W6fk4p-7ZXtI9vc5HXqpyWaq1UhssV_9dfQCIjkCI</recordid><startdate>20120809</startdate><enddate>20120809</enddate><creator>HAWKS, MARSHALL, WELLS</creator><creator>WOYTOWITZ, MICHAEL, A</creator><scope>EVB</scope></search><sort><creationdate>20120809</creationdate><title>SYSTEM AND METHOD FOR CREATING AND MAINTAINING A DATABASE OF DISAMBIGUATED ENTITY MENTIONS AND RELATIONS FROM A CORPUS OF ELECTRONIC DOCUMENTS</title><author>HAWKS, MARSHALL, WELLS ; WOYTOWITZ, MICHAEL, A</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2012106008A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2012</creationdate><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>PHYSICS</topic><toplevel>online_resources</toplevel><creatorcontrib>HAWKS, MARSHALL, WELLS</creatorcontrib><creatorcontrib>WOYTOWITZ, MICHAEL, A</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>HAWKS, MARSHALL, WELLS</au><au>WOYTOWITZ, MICHAEL, A</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>SYSTEM AND METHOD FOR CREATING AND MAINTAINING A DATABASE OF DISAMBIGUATED ENTITY MENTIONS AND RELATIONS FROM A CORPUS OF ELECTRONIC DOCUMENTS</title><date>2012-08-09</date><risdate>2012</risdate><abstract>Method and apparatus for creating an electronic database of disambiguated entity mentions and relations from a corpus of electronic documents. The invention automatically extracts from the corpus of electronic documents mentions about entities (e.g., references to people, organizations or places), parses the entity mentions into "mention objects," and executes a series of grouping, comparison and hierarchical fuzzy object clustering algorithms to cluster together in an electronic database all of the mention objects referring to the same entity and all of the mention objects (e.g. "people") associated with each other by a relationship (e.g., "co-authors" or "family members"). The resulting electronic database of disambiguated entity mentions and relations, which may comprise, for example, an XML document, a relational database or hierarchical database, is structured to permit useful recordation, access, review and display of all of the mentions and relations associated with a particular entity or collection of entities. L'invention concerne un procédé et un appareil de création d'une base de données électronique de mentions d'entité désambiguïsées et de relations à partir d'un corpus de documents électroniques. L'invention extrait automatiquement du corpus de documents électroniques des mentions concernant des entités (par exemple des références à des personnes, à des organisations ou à des lieux), décompose les mentions d'entité en « objets de mention », et exécute une série d'algorithmes de groupement, de comparaison et de regroupement d'objets flous, hiérarchiques, afin de regrouper ensemble dans une base de données électronique tous les objets de mention se rapportant à la même entité et tous les objets de mention (par exemple des « personnes ») associés l'un à l'autre par une relation (par exemple « co-auteurs » ou « membres d'une même famille »). La base de données électronique résultante de mentions d'entité désambiguïsées et de relations, qui peut comprendre, par exemple, un document XML, une base de données relationnelle ou une base de données hiérarchique, est structurée pour permettre un enregistrement, un accès, un examen et un affichage utiles de toutes les mentions et relations associées à une entité ou à une collection d'entités particulière.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2012106008A1
source esp@cenet
subjects CALCULATING
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
PHYSICS
title SYSTEM AND METHOD FOR CREATING AND MAINTAINING A DATABASE OF DISAMBIGUATED ENTITY MENTIONS AND RELATIONS FROM A CORPUS OF ELECTRONIC DOCUMENTS
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-14T07%3A23%3A12IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=HAWKS,%20MARSHALL,%20WELLS&rft.date=2012-08-09&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2012106008A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true