Verfahren, Einheit und Computerprogramm zum Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit bei Elementen, die in einem Textdatenstrom enthalten sind

Die vorliegende Erfindung bezieht sich auf ein Verfahren, eine Einheit und ein Computerprogramm für das effiziente Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit innerhalb von Elementen, die in einem umfangreichen Textdatenstrom enthalten sind.Identifizierungsdaten zum Identifizier...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: Rudy, Raymond Harry, Koyanagi, Teruo, Osogami, Takayuki
Format: Patent
Sprache:ger
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator Rudy, Raymond Harry
Koyanagi, Teruo
Osogami, Takayuki
description Die vorliegende Erfindung bezieht sich auf ein Verfahren, eine Einheit und ein Computerprogramm für das effiziente Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit innerhalb von Elementen, die in einem umfangreichen Textdatenstrom enthalten sind.Identifizierungsdaten zum Identifizieren eines Elements und eines Zählwerts von Elementen werden in einer höheren Speicherebene gespeichert, und lediglich Identifizierungsdaten werden in einer tieferen Speicherebene unterhalb der höheren Speicherebene gespeichert. Eine Textdatenstrom-Eingabe wird empfangen, das Inkrement des Zählwerts eines Elements wird als Reaktion auf das Speichern von Identifizierungsdaten für ein Element, das in einem Intervall enthalten ist, der von der empfangenen Textdatenstrom-Eingabe getrennt ist, in dem Speicher einer höheren Ebene erhöht, die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion auf das Speichern in der tieferen Speicherebene in die höhere Speicherebene übertragen, und die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion darauf, dass sie in keiner Ebene gespeichert sind, in der höheren Speicherebene neu gespeichert. A method, device and computer program for efficiently identifying items having a high frequency of occurrence among items included in a large-volume text data stream. Identification information for identifying an item and a count of items are stored in a higher level of memory and only identification information is stored in a lower level. Text data stream input is received, the increment of the count of an item is increased in response to storage in the higher level memory of identification information for an item included in a bucket divided from the received text data stream input, identification information for the item is transferred with the initial count to the higher level of memory in response to storage in the lower level and the identification information for the item is newly stored with the initial count in the higher level in response to not being stored on any level.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_DE102013205819B4</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>DE102013205819B4</sourcerecordid><originalsourceid>FETCH-epo_espacenet_DE102013205819B43</originalsourceid><addsrcrecordid>eNqNjMFKAzEURWfjQqr_8DbuKsy0Crps64jui9uSNjfNo5OXIXkR6fcIfog_ZiqC264u93LOvWy-3pCc8QkypZ7Fg5WKWFrFMBZFGlPcJxMCHUugVwtRdnxkVIHeo1A_INSxtlBNsCCRj772RXGaWDX778_ieH84XW_B_8qULINYfrVAa3yoNXXPmmKgingznJ4zi71qLpwZMq7_ctLcPPfr1cstxrhBHs0OAt089V07a7v5rL1_6B6Xd_NzuR9yXlrG</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>Verfahren, Einheit und Computerprogramm zum Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit bei Elementen, die in einem Textdatenstrom enthalten sind</title><source>esp@cenet</source><creator>Rudy, Raymond Harry ; Koyanagi, Teruo ; Osogami, Takayuki</creator><creatorcontrib>Rudy, Raymond Harry ; Koyanagi, Teruo ; Osogami, Takayuki</creatorcontrib><description>Die vorliegende Erfindung bezieht sich auf ein Verfahren, eine Einheit und ein Computerprogramm für das effiziente Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit innerhalb von Elementen, die in einem umfangreichen Textdatenstrom enthalten sind.Identifizierungsdaten zum Identifizieren eines Elements und eines Zählwerts von Elementen werden in einer höheren Speicherebene gespeichert, und lediglich Identifizierungsdaten werden in einer tieferen Speicherebene unterhalb der höheren Speicherebene gespeichert. Eine Textdatenstrom-Eingabe wird empfangen, das Inkrement des Zählwerts eines Elements wird als Reaktion auf das Speichern von Identifizierungsdaten für ein Element, das in einem Intervall enthalten ist, der von der empfangenen Textdatenstrom-Eingabe getrennt ist, in dem Speicher einer höheren Ebene erhöht, die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion auf das Speichern in der tieferen Speicherebene in die höhere Speicherebene übertragen, und die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion darauf, dass sie in keiner Ebene gespeichert sind, in der höheren Speicherebene neu gespeichert. A method, device and computer program for efficiently identifying items having a high frequency of occurrence among items included in a large-volume text data stream. Identification information for identifying an item and a count of items are stored in a higher level of memory and only identification information is stored in a lower level. Text data stream input is received, the increment of the count of an item is increased in response to storage in the higher level memory of identification information for an item included in a bucket divided from the received text data stream input, identification information for the item is transferred with the initial count to the higher level of memory in response to storage in the lower level and the identification information for the item is newly stored with the initial count in the higher level in response to not being stored on any level.</description><language>ger</language><subject>CALCULATING ; COMPUTING ; COUNTING ; ELECTRIC COMMUNICATION TECHNIQUE ; ELECTRIC DIGITAL DATA PROCESSING ; ELECTRICITY ; PHYSICS ; TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION</subject><creationdate>2020</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20200402&amp;DB=EPODOC&amp;CC=DE&amp;NR=102013205819B4$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25543,76294</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20200402&amp;DB=EPODOC&amp;CC=DE&amp;NR=102013205819B4$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>Rudy, Raymond Harry</creatorcontrib><creatorcontrib>Koyanagi, Teruo</creatorcontrib><creatorcontrib>Osogami, Takayuki</creatorcontrib><title>Verfahren, Einheit und Computerprogramm zum Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit bei Elementen, die in einem Textdatenstrom enthalten sind</title><description>Die vorliegende Erfindung bezieht sich auf ein Verfahren, eine Einheit und ein Computerprogramm für das effiziente Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit innerhalb von Elementen, die in einem umfangreichen Textdatenstrom enthalten sind.Identifizierungsdaten zum Identifizieren eines Elements und eines Zählwerts von Elementen werden in einer höheren Speicherebene gespeichert, und lediglich Identifizierungsdaten werden in einer tieferen Speicherebene unterhalb der höheren Speicherebene gespeichert. Eine Textdatenstrom-Eingabe wird empfangen, das Inkrement des Zählwerts eines Elements wird als Reaktion auf das Speichern von Identifizierungsdaten für ein Element, das in einem Intervall enthalten ist, der von der empfangenen Textdatenstrom-Eingabe getrennt ist, in dem Speicher einer höheren Ebene erhöht, die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion auf das Speichern in der tieferen Speicherebene in die höhere Speicherebene übertragen, und die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion darauf, dass sie in keiner Ebene gespeichert sind, in der höheren Speicherebene neu gespeichert. A method, device and computer program for efficiently identifying items having a high frequency of occurrence among items included in a large-volume text data stream. Identification information for identifying an item and a count of items are stored in a higher level of memory and only identification information is stored in a lower level. Text data stream input is received, the increment of the count of an item is increased in response to storage in the higher level memory of identification information for an item included in a bucket divided from the received text data stream input, identification information for the item is transferred with the initial count to the higher level of memory in response to storage in the lower level and the identification information for the item is newly stored with the initial count in the higher level in response to not being stored on any level.</description><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC COMMUNICATION TECHNIQUE</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>ELECTRICITY</subject><subject>PHYSICS</subject><subject>TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2020</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNqNjMFKAzEURWfjQqr_8DbuKsy0Crps64jui9uSNjfNo5OXIXkR6fcIfog_ZiqC264u93LOvWy-3pCc8QkypZ7Fg5WKWFrFMBZFGlPcJxMCHUugVwtRdnxkVIHeo1A_INSxtlBNsCCRj772RXGaWDX778_ieH84XW_B_8qULINYfrVAa3yoNXXPmmKgingznJ4zi71qLpwZMq7_ctLcPPfr1cstxrhBHs0OAt089V07a7v5rL1_6B6Xd_NzuR9yXlrG</recordid><startdate>20200402</startdate><enddate>20200402</enddate><creator>Rudy, Raymond Harry</creator><creator>Koyanagi, Teruo</creator><creator>Osogami, Takayuki</creator><scope>EVB</scope></search><sort><creationdate>20200402</creationdate><title>Verfahren, Einheit und Computerprogramm zum Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit bei Elementen, die in einem Textdatenstrom enthalten sind</title><author>Rudy, Raymond Harry ; Koyanagi, Teruo ; Osogami, Takayuki</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_DE102013205819B43</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>ger</language><creationdate>2020</creationdate><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC COMMUNICATION TECHNIQUE</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>ELECTRICITY</topic><topic>PHYSICS</topic><topic>TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION</topic><toplevel>online_resources</toplevel><creatorcontrib>Rudy, Raymond Harry</creatorcontrib><creatorcontrib>Koyanagi, Teruo</creatorcontrib><creatorcontrib>Osogami, Takayuki</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>Rudy, Raymond Harry</au><au>Koyanagi, Teruo</au><au>Osogami, Takayuki</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>Verfahren, Einheit und Computerprogramm zum Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit bei Elementen, die in einem Textdatenstrom enthalten sind</title><date>2020-04-02</date><risdate>2020</risdate><abstract>Die vorliegende Erfindung bezieht sich auf ein Verfahren, eine Einheit und ein Computerprogramm für das effiziente Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit innerhalb von Elementen, die in einem umfangreichen Textdatenstrom enthalten sind.Identifizierungsdaten zum Identifizieren eines Elements und eines Zählwerts von Elementen werden in einer höheren Speicherebene gespeichert, und lediglich Identifizierungsdaten werden in einer tieferen Speicherebene unterhalb der höheren Speicherebene gespeichert. Eine Textdatenstrom-Eingabe wird empfangen, das Inkrement des Zählwerts eines Elements wird als Reaktion auf das Speichern von Identifizierungsdaten für ein Element, das in einem Intervall enthalten ist, der von der empfangenen Textdatenstrom-Eingabe getrennt ist, in dem Speicher einer höheren Ebene erhöht, die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion auf das Speichern in der tieferen Speicherebene in die höhere Speicherebene übertragen, und die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion darauf, dass sie in keiner Ebene gespeichert sind, in der höheren Speicherebene neu gespeichert. A method, device and computer program for efficiently identifying items having a high frequency of occurrence among items included in a large-volume text data stream. Identification information for identifying an item and a count of items are stored in a higher level of memory and only identification information is stored in a lower level. Text data stream input is received, the increment of the count of an item is increased in response to storage in the higher level memory of identification information for an item included in a bucket divided from the received text data stream input, identification information for the item is transferred with the initial count to the higher level of memory in response to storage in the lower level and the identification information for the item is newly stored with the initial count in the higher level in response to not being stored on any level.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language ger
recordid cdi_epo_espacenet_DE102013205819B4
source esp@cenet
subjects CALCULATING
COMPUTING
COUNTING
ELECTRIC COMMUNICATION TECHNIQUE
ELECTRIC DIGITAL DATA PROCESSING
ELECTRICITY
PHYSICS
TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION
title Verfahren, Einheit und Computerprogramm zum Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit bei Elementen, die in einem Textdatenstrom enthalten sind
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-21T18%3A54%3A52IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=Rudy,%20Raymond%20Harry&rft.date=2020-04-02&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EDE102013205819B4%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true