SYSTEMATIC MASS NORMALIZATION OF INTERNATIONAL TITLES

A system for generating a database of labeled foreign canonical titles includes an interface and a processor. The interface is to receive a title in a second language. The processor is to 1) store a set of n-grams in a first language in a first database; 2) sanitize the title into a sanitize title i...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: GIVERTS, Viadimir, FAN, Xiao, AU, Michael, NAMJOSHI, Parag, Avinash, GATELEY, Kristy, BOOB, Pavan
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator GIVERTS, Viadimir
FAN, Xiao
AU, Michael
NAMJOSHI, Parag, Avinash
GATELEY, Kristy
BOOB, Pavan
description A system for generating a database of labeled foreign canonical titles includes an interface and a processor. The interface is to receive a title in a second language. The processor is to 1) store a set of n-grams in a first language in a first database; 2) sanitize the title into a sanitize title in the second language; 3) translate the sanitized title into a translated title in the first language; 4) break the translated title into n-grams; 5) determine labels for the n-grams using the first database; and 6) determine label to associate with the title. Selon l'invention, un système de génération d'une base de données de titres canoniques étrangers étiquetés comprend une interface et un processeur. L'interface sert à recevoir un titre dans une seconde langue. Le processeur sert: à stocker dans une première base de données un ensemble de n-grammes dans une première langue; 2) à épurer le titre en un titre épuré dans la seconde langue; 3) à traduire le titre épuré en un titre traduit dans la première langue; 4) à réduire le titre traduit en n-grammes; 5) à déterminer des étiquettes pour les n-grammes au moyen de la première base de données; et 6) à déterminer une étiquette à associer au titre.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2017146889A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2017146889A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2017146889A13</originalsourceid><addsrcrecordid>eNrjZDANjgwOcfV1DPF0VvB1DA5W8PMP8nX08YwCivj7Kfi7KXj6hbgG-YG5jj4KIZ4hPq7BPAysaYk5xam8UJqbQdnNNcTZQze1ID8-tbggMTk1L7UkPtzfyMDQ3NDEzMLC0tHQmDhVAMqmKSs</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>SYSTEMATIC MASS NORMALIZATION OF INTERNATIONAL TITLES</title><source>esp@cenet</source><creator>GIVERTS, Viadimir ; FAN, Xiao ; AU, Michael ; NAMJOSHI, Parag, Avinash ; GATELEY, Kristy ; BOOB, Pavan</creator><creatorcontrib>GIVERTS, Viadimir ; FAN, Xiao ; AU, Michael ; NAMJOSHI, Parag, Avinash ; GATELEY, Kristy ; BOOB, Pavan</creatorcontrib><description>A system for generating a database of labeled foreign canonical titles includes an interface and a processor. The interface is to receive a title in a second language. The processor is to 1) store a set of n-grams in a first language in a first database; 2) sanitize the title into a sanitize title in the second language; 3) translate the sanitized title into a translated title in the first language; 4) break the translated title into n-grams; 5) determine labels for the n-grams using the first database; and 6) determine label to associate with the title. Selon l'invention, un système de génération d'une base de données de titres canoniques étrangers étiquetés comprend une interface et un processeur. L'interface sert à recevoir un titre dans une seconde langue. Le processeur sert: à stocker dans une première base de données un ensemble de n-grammes dans une première langue; 2) à épurer le titre en un titre épuré dans la seconde langue; 3) à traduire le titre épuré en un titre traduit dans la première langue; 4) à réduire le titre traduit en n-grammes; 5) à déterminer des étiquettes pour les n-grammes au moyen de la première base de données; et 6) à déterminer une étiquette à associer au titre.</description><language>eng ; fre</language><subject>CALCULATING ; COMPUTING ; COUNTING ; ELECTRIC DIGITAL DATA PROCESSING ; PHYSICS</subject><creationdate>2017</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20170831&amp;DB=EPODOC&amp;CC=WO&amp;NR=2017146889A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25543,76293</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20170831&amp;DB=EPODOC&amp;CC=WO&amp;NR=2017146889A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>GIVERTS, Viadimir</creatorcontrib><creatorcontrib>FAN, Xiao</creatorcontrib><creatorcontrib>AU, Michael</creatorcontrib><creatorcontrib>NAMJOSHI, Parag, Avinash</creatorcontrib><creatorcontrib>GATELEY, Kristy</creatorcontrib><creatorcontrib>BOOB, Pavan</creatorcontrib><title>SYSTEMATIC MASS NORMALIZATION OF INTERNATIONAL TITLES</title><description>A system for generating a database of labeled foreign canonical titles includes an interface and a processor. The interface is to receive a title in a second language. The processor is to 1) store a set of n-grams in a first language in a first database; 2) sanitize the title into a sanitize title in the second language; 3) translate the sanitized title into a translated title in the first language; 4) break the translated title into n-grams; 5) determine labels for the n-grams using the first database; and 6) determine label to associate with the title. Selon l'invention, un système de génération d'une base de données de titres canoniques étrangers étiquetés comprend une interface et un processeur. L'interface sert à recevoir un titre dans une seconde langue. Le processeur sert: à stocker dans une première base de données un ensemble de n-grammes dans une première langue; 2) à épurer le titre en un titre épuré dans la seconde langue; 3) à traduire le titre épuré en un titre traduit dans la première langue; 4) à réduire le titre traduit en n-grammes; 5) à déterminer des étiquettes pour les n-grammes au moyen de la première base de données; et 6) à déterminer une étiquette à associer au titre.</description><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>PHYSICS</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2017</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZDANjgwOcfV1DPF0VvB1DA5W8PMP8nX08YwCivj7Kfi7KXj6hbgG-YG5jj4KIZ4hPq7BPAysaYk5xam8UJqbQdnNNcTZQze1ID8-tbggMTk1L7UkPtzfyMDQ3NDEzMLC0tHQmDhVAMqmKSs</recordid><startdate>20170831</startdate><enddate>20170831</enddate><creator>GIVERTS, Viadimir</creator><creator>FAN, Xiao</creator><creator>AU, Michael</creator><creator>NAMJOSHI, Parag, Avinash</creator><creator>GATELEY, Kristy</creator><creator>BOOB, Pavan</creator><scope>EVB</scope></search><sort><creationdate>20170831</creationdate><title>SYSTEMATIC MASS NORMALIZATION OF INTERNATIONAL TITLES</title><author>GIVERTS, Viadimir ; FAN, Xiao ; AU, Michael ; NAMJOSHI, Parag, Avinash ; GATELEY, Kristy ; BOOB, Pavan</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2017146889A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2017</creationdate><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>PHYSICS</topic><toplevel>online_resources</toplevel><creatorcontrib>GIVERTS, Viadimir</creatorcontrib><creatorcontrib>FAN, Xiao</creatorcontrib><creatorcontrib>AU, Michael</creatorcontrib><creatorcontrib>NAMJOSHI, Parag, Avinash</creatorcontrib><creatorcontrib>GATELEY, Kristy</creatorcontrib><creatorcontrib>BOOB, Pavan</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>GIVERTS, Viadimir</au><au>FAN, Xiao</au><au>AU, Michael</au><au>NAMJOSHI, Parag, Avinash</au><au>GATELEY, Kristy</au><au>BOOB, Pavan</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>SYSTEMATIC MASS NORMALIZATION OF INTERNATIONAL TITLES</title><date>2017-08-31</date><risdate>2017</risdate><abstract>A system for generating a database of labeled foreign canonical titles includes an interface and a processor. The interface is to receive a title in a second language. The processor is to 1) store a set of n-grams in a first language in a first database; 2) sanitize the title into a sanitize title in the second language; 3) translate the sanitized title into a translated title in the first language; 4) break the translated title into n-grams; 5) determine labels for the n-grams using the first database; and 6) determine label to associate with the title. Selon l'invention, un système de génération d'une base de données de titres canoniques étrangers étiquetés comprend une interface et un processeur. L'interface sert à recevoir un titre dans une seconde langue. Le processeur sert: à stocker dans une première base de données un ensemble de n-grammes dans une première langue; 2) à épurer le titre en un titre épuré dans la seconde langue; 3) à traduire le titre épuré en un titre traduit dans la première langue; 4) à réduire le titre traduit en n-grammes; 5) à déterminer des étiquettes pour les n-grammes au moyen de la première base de données; et 6) à déterminer une étiquette à associer au titre.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2017146889A1
source esp@cenet
subjects CALCULATING
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
PHYSICS
title SYSTEMATIC MASS NORMALIZATION OF INTERNATIONAL TITLES
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-25T10%3A45%3A15IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=GIVERTS,%20Viadimir&rft.date=2017-08-31&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2017146889A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true