AGGREGATION OF NOISY DATASETS INTO MASTER FIRMOGRAPHIC DATABASE

Aggregation of noisy datasets into a master firmographic database. In an embodiment, firmographic records are received from a plurality of sources, and normalized into a common schema. One or more firmographic records may be cleaned by replacing a value of one or more fields in those firmographic re...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: VO, Tai, HSIUNG, Daniel, VIJAYVARGIYA, Nitin, SHAH, Premal, BAJARIA, Viral, PALAKODETY, Akshara
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator VO, Tai
HSIUNG, Daniel
VIJAYVARGIYA, Nitin
SHAH, Premal
BAJARIA, Viral
PALAKODETY, Akshara
description Aggregation of noisy datasets into a master firmographic database. In an embodiment, firmographic records are received from a plurality of sources, and normalized into a common schema. One or more firmographic records may be cleaned by replacing a value of one or more fields in those firmographic record(s) with a value of those field(s) in another firmographic record. The firmographic records may then be clustered, and each of the clusters may be collapsed into a single conflated firmographic record based on a voting process. A master identifier may be generated for each conflated firmographic record, and the conflated firmographic records may be merged into a master firmographic database that is indexed by master identifiers. Agrégation de jeux de données bruités en une base de données maîtresse de démographie des entreprises. Selon un mode de réalisation, des enregistrements de démographie des entreprises sont reçus en provenance d'une pluralité de sources, et normalisés en un schéma commun. Un ou plusieurs enregistrements de démographie des entreprises peuvent être nettoyés en remplaçant une valeur d'un ou plusieurs champs dans ledit ou lesdits enregistrements de démographie des entreprises par une valeur de ce(s) champ(s) dans un autre enregistrement de démographie des entreprises. Les enregistrements de démographie des entreprises peuvent ensuite être regroupés, et chacun des groupements peut être replié en un single enregistrement amalgamé de démographie des entreprises selon un processus de vote. Un identifiant maître peut être généré pour chaque enregistrement amalgamé de démographie des entreprises, et les enregistrements amalgamés de démographie des entreprises peuvent être fusionnés en une base de données maîtresse de démographie des entreprises qui est indexée par les identifiants maîtres.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2022006151A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2022006151A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2022006151A13</originalsourceid><addsrcrecordid>eNrjZLB3dHcPcnV3DPH091Pwd1Pw8_cMjlRwcQxxDHYNCVbw9AvxV_B1DA5xDVJw8wzy9XcPcgzw8HQGq3ACquFhYE1LzClO5YXS3AzKbq4hzh66qQX58anFBYnJqXmpJfHh_kYGRkYGBmaGpoaOhsbEqQIALH0rOg</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>AGGREGATION OF NOISY DATASETS INTO MASTER FIRMOGRAPHIC DATABASE</title><source>esp@cenet</source><creator>VO, Tai ; HSIUNG, Daniel ; VIJAYVARGIYA, Nitin ; SHAH, Premal ; BAJARIA, Viral ; PALAKODETY, Akshara</creator><creatorcontrib>VO, Tai ; HSIUNG, Daniel ; VIJAYVARGIYA, Nitin ; SHAH, Premal ; BAJARIA, Viral ; PALAKODETY, Akshara</creatorcontrib><description>Aggregation of noisy datasets into a master firmographic database. In an embodiment, firmographic records are received from a plurality of sources, and normalized into a common schema. One or more firmographic records may be cleaned by replacing a value of one or more fields in those firmographic record(s) with a value of those field(s) in another firmographic record. The firmographic records may then be clustered, and each of the clusters may be collapsed into a single conflated firmographic record based on a voting process. A master identifier may be generated for each conflated firmographic record, and the conflated firmographic records may be merged into a master firmographic database that is indexed by master identifiers. Agrégation de jeux de données bruités en une base de données maîtresse de démographie des entreprises. Selon un mode de réalisation, des enregistrements de démographie des entreprises sont reçus en provenance d'une pluralité de sources, et normalisés en un schéma commun. Un ou plusieurs enregistrements de démographie des entreprises peuvent être nettoyés en remplaçant une valeur d'un ou plusieurs champs dans ledit ou lesdits enregistrements de démographie des entreprises par une valeur de ce(s) champ(s) dans un autre enregistrement de démographie des entreprises. Les enregistrements de démographie des entreprises peuvent ensuite être regroupés, et chacun des groupements peut être replié en un single enregistrement amalgamé de démographie des entreprises selon un processus de vote. Un identifiant maître peut être généré pour chaque enregistrement amalgamé de démographie des entreprises, et les enregistrements amalgamés de démographie des entreprises peuvent être fusionnés en une base de données maîtresse de démographie des entreprises qui est indexée par les identifiants maîtres.</description><language>eng ; fre</language><subject>CALCULATING ; COMPUTING ; COUNTING ; ELECTRIC DIGITAL DATA PROCESSING ; PHYSICS</subject><creationdate>2022</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20220106&amp;DB=EPODOC&amp;CC=WO&amp;NR=2022006151A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25542,76516</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20220106&amp;DB=EPODOC&amp;CC=WO&amp;NR=2022006151A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>VO, Tai</creatorcontrib><creatorcontrib>HSIUNG, Daniel</creatorcontrib><creatorcontrib>VIJAYVARGIYA, Nitin</creatorcontrib><creatorcontrib>SHAH, Premal</creatorcontrib><creatorcontrib>BAJARIA, Viral</creatorcontrib><creatorcontrib>PALAKODETY, Akshara</creatorcontrib><title>AGGREGATION OF NOISY DATASETS INTO MASTER FIRMOGRAPHIC DATABASE</title><description>Aggregation of noisy datasets into a master firmographic database. In an embodiment, firmographic records are received from a plurality of sources, and normalized into a common schema. One or more firmographic records may be cleaned by replacing a value of one or more fields in those firmographic record(s) with a value of those field(s) in another firmographic record. The firmographic records may then be clustered, and each of the clusters may be collapsed into a single conflated firmographic record based on a voting process. A master identifier may be generated for each conflated firmographic record, and the conflated firmographic records may be merged into a master firmographic database that is indexed by master identifiers. Agrégation de jeux de données bruités en une base de données maîtresse de démographie des entreprises. Selon un mode de réalisation, des enregistrements de démographie des entreprises sont reçus en provenance d'une pluralité de sources, et normalisés en un schéma commun. Un ou plusieurs enregistrements de démographie des entreprises peuvent être nettoyés en remplaçant une valeur d'un ou plusieurs champs dans ledit ou lesdits enregistrements de démographie des entreprises par une valeur de ce(s) champ(s) dans un autre enregistrement de démographie des entreprises. Les enregistrements de démographie des entreprises peuvent ensuite être regroupés, et chacun des groupements peut être replié en un single enregistrement amalgamé de démographie des entreprises selon un processus de vote. Un identifiant maître peut être généré pour chaque enregistrement amalgamé de démographie des entreprises, et les enregistrements amalgamés de démographie des entreprises peuvent être fusionnés en une base de données maîtresse de démographie des entreprises qui est indexée par les identifiants maîtres.</description><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>PHYSICS</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2022</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZLB3dHcPcnV3DPH091Pwd1Pw8_cMjlRwcQxxDHYNCVbw9AvxV_B1DA5xDVJw8wzy9XcPcgzw8HQGq3ACquFhYE1LzClO5YXS3AzKbq4hzh66qQX58anFBYnJqXmpJfHh_kYGRkYGBmaGpoaOhsbEqQIALH0rOg</recordid><startdate>20220106</startdate><enddate>20220106</enddate><creator>VO, Tai</creator><creator>HSIUNG, Daniel</creator><creator>VIJAYVARGIYA, Nitin</creator><creator>SHAH, Premal</creator><creator>BAJARIA, Viral</creator><creator>PALAKODETY, Akshara</creator><scope>EVB</scope></search><sort><creationdate>20220106</creationdate><title>AGGREGATION OF NOISY DATASETS INTO MASTER FIRMOGRAPHIC DATABASE</title><author>VO, Tai ; HSIUNG, Daniel ; VIJAYVARGIYA, Nitin ; SHAH, Premal ; BAJARIA, Viral ; PALAKODETY, Akshara</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2022006151A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2022</creationdate><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>PHYSICS</topic><toplevel>online_resources</toplevel><creatorcontrib>VO, Tai</creatorcontrib><creatorcontrib>HSIUNG, Daniel</creatorcontrib><creatorcontrib>VIJAYVARGIYA, Nitin</creatorcontrib><creatorcontrib>SHAH, Premal</creatorcontrib><creatorcontrib>BAJARIA, Viral</creatorcontrib><creatorcontrib>PALAKODETY, Akshara</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>VO, Tai</au><au>HSIUNG, Daniel</au><au>VIJAYVARGIYA, Nitin</au><au>SHAH, Premal</au><au>BAJARIA, Viral</au><au>PALAKODETY, Akshara</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>AGGREGATION OF NOISY DATASETS INTO MASTER FIRMOGRAPHIC DATABASE</title><date>2022-01-06</date><risdate>2022</risdate><abstract>Aggregation of noisy datasets into a master firmographic database. In an embodiment, firmographic records are received from a plurality of sources, and normalized into a common schema. One or more firmographic records may be cleaned by replacing a value of one or more fields in those firmographic record(s) with a value of those field(s) in another firmographic record. The firmographic records may then be clustered, and each of the clusters may be collapsed into a single conflated firmographic record based on a voting process. A master identifier may be generated for each conflated firmographic record, and the conflated firmographic records may be merged into a master firmographic database that is indexed by master identifiers. Agrégation de jeux de données bruités en une base de données maîtresse de démographie des entreprises. Selon un mode de réalisation, des enregistrements de démographie des entreprises sont reçus en provenance d'une pluralité de sources, et normalisés en un schéma commun. Un ou plusieurs enregistrements de démographie des entreprises peuvent être nettoyés en remplaçant une valeur d'un ou plusieurs champs dans ledit ou lesdits enregistrements de démographie des entreprises par une valeur de ce(s) champ(s) dans un autre enregistrement de démographie des entreprises. Les enregistrements de démographie des entreprises peuvent ensuite être regroupés, et chacun des groupements peut être replié en un single enregistrement amalgamé de démographie des entreprises selon un processus de vote. Un identifiant maître peut être généré pour chaque enregistrement amalgamé de démographie des entreprises, et les enregistrements amalgamés de démographie des entreprises peuvent être fusionnés en une base de données maîtresse de démographie des entreprises qui est indexée par les identifiants maîtres.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2022006151A1
source esp@cenet
subjects CALCULATING
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
PHYSICS
title AGGREGATION OF NOISY DATASETS INTO MASTER FIRMOGRAPHIC DATABASE
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-02-14T06%3A18%3A45IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=VO,%20Tai&rft.date=2022-01-06&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2022006151A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true