Automatische Klassifikation eines Dokumentenpools mit einem neuronalen System

Gemäß der Erfindung wird ein Verfahren zur Erzeugung einer Klassifizierung einer Vielzahl von Textdokumenten mittels eines Computers unter Verwendung eines neuronalen Netzes beschrieben, wobei das neuronale Netz eine Vielzahl von vorbestimmbaren Startwörtern aus einem oder mehreren Wörtern aufweist...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: WINKLER, MARIA, SCHROEDER-BERGEN, ECKART, HOFMANN, SOLVEIG
Format: Patent
Sprache:ger
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator WINKLER, MARIA
SCHROEDER-BERGEN, ECKART
HOFMANN, SOLVEIG
description Gemäß der Erfindung wird ein Verfahren zur Erzeugung einer Klassifizierung einer Vielzahl von Textdokumenten mittels eines Computers unter Verwendung eines neuronalen Netzes beschrieben, wobei das neuronale Netz eine Vielzahl von vorbestimmbaren Startwörtern aus einem oder mehreren Wörtern aufweist und in mehreren Ebenen strukturiert ist, umfassend die folgenden Schritte: - Einlesen von Textdokumenten mit einer beliebigen Vielzahl von Wörtern in das neuronale Netz; - Bilden eines Primärkontextes wenigstens eines vorbestimmten Startworts aus sämtlichen Assoziationsrelationen, die von dem Startwort ausgehen; - Zuordnen einzelner Texteinheiten der Textdokumente zu den Startbegriffen oder dem Primärkontext; - Erzeugen und/oder Ermitteln von Assoziationsrelationen zwischen einem oder mehreren Startwörtern bzw. ihres Primärkontextes und den Wörtern der Texteinheiten der Textdokumente, wobei die Anzahl der ermittelten Assoziationsrelationen zwischen jedem Startwort und den Wörtern der Texteinheit als Maßstab zum Klassifizieren des Textdokumentes dient; - Klassifizieren eines Texdokumentes durch Kumulieren von Klassifizierungswerten aus den Textelementen; und - Erzeugen wenigstens eines Taxonomiebaums mit Taxonomiezweigen und/oder Taxonomieknoten bzw. Neuronen und/oder Unterbäumen und/oder Taxonomieebobei Synapsenverbindungen zwischen den Neuronen und/oder Taxanomieknoten, welche den Startwörtern zuordenbar sind, in automatisierter Form hergestellt werden und wobei zu jedem Startwort wenigstens ein Unterbaum erzeugt wird. The invention relates to a method for producing a classification of a plurality of text documents by means of a computer using a neural network, wherein the neural network has a plurality of start words that can be predetermined, comprising one or more words, and is structured in several levels. The method comprises the following steps: reading text documents having an arbitrary number of words into the neural network; forming a primary context of at least one predetermined start word from all association relations that proceed from the start word; associating individual text units of the text documents with the start terms or the primary context; producing and/or determining association relations between one or more start words or the primary context thereof and the words of the text units of the text documents, wherein the number of determined association relations between each start word and the words of the text unit is used as a scale for cl
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_DE102011009376A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>DE102011009376A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_DE102011009376A13</originalsourceid><addsrcrecordid>eNqNirEKwjAURbs4iPoPWRyFxILiWGxFECfdSyi3GJq8F3wvg3-viB_gdOCcM6-uTVFOXoMMD5hL9CJhDNNHMBkEgpiWp5JACsrMUUwK-i3JEMqTyUeQub1EkZbVbPRRsPpxUa1P3f143iBzD8l-AEH7tnN2a52z9lDvd42r__3eCCk4nA</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>Automatische Klassifikation eines Dokumentenpools mit einem neuronalen System</title><source>esp@cenet</source><creator>WINKLER, MARIA ; SCHROEDER-BERGEN, ECKART ; HOFMANN, SOLVEIG</creator><creatorcontrib>WINKLER, MARIA ; SCHROEDER-BERGEN, ECKART ; HOFMANN, SOLVEIG</creatorcontrib><description>Gemäß der Erfindung wird ein Verfahren zur Erzeugung einer Klassifizierung einer Vielzahl von Textdokumenten mittels eines Computers unter Verwendung eines neuronalen Netzes beschrieben, wobei das neuronale Netz eine Vielzahl von vorbestimmbaren Startwörtern aus einem oder mehreren Wörtern aufweist und in mehreren Ebenen strukturiert ist, umfassend die folgenden Schritte: - Einlesen von Textdokumenten mit einer beliebigen Vielzahl von Wörtern in das neuronale Netz; - Bilden eines Primärkontextes wenigstens eines vorbestimmten Startworts aus sämtlichen Assoziationsrelationen, die von dem Startwort ausgehen; - Zuordnen einzelner Texteinheiten der Textdokumente zu den Startbegriffen oder dem Primärkontext; - Erzeugen und/oder Ermitteln von Assoziationsrelationen zwischen einem oder mehreren Startwörtern bzw. ihres Primärkontextes und den Wörtern der Texteinheiten der Textdokumente, wobei die Anzahl der ermittelten Assoziationsrelationen zwischen jedem Startwort und den Wörtern der Texteinheit als Maßstab zum Klassifizieren des Textdokumentes dient; - Klassifizieren eines Texdokumentes durch Kumulieren von Klassifizierungswerten aus den Textelementen; und - Erzeugen wenigstens eines Taxonomiebaums mit Taxonomiezweigen und/oder Taxonomieknoten bzw. Neuronen und/oder Unterbäumen und/oder Taxonomieebobei Synapsenverbindungen zwischen den Neuronen und/oder Taxanomieknoten, welche den Startwörtern zuordenbar sind, in automatisierter Form hergestellt werden und wobei zu jedem Startwort wenigstens ein Unterbaum erzeugt wird. The invention relates to a method for producing a classification of a plurality of text documents by means of a computer using a neural network, wherein the neural network has a plurality of start words that can be predetermined, comprising one or more words, and is structured in several levels. The method comprises the following steps: reading text documents having an arbitrary number of words into the neural network; forming a primary context of at least one predetermined start word from all association relations that proceed from the start word; associating individual text units of the text documents with the start terms or the primary context; producing and/or determining association relations between one or more start words or the primary context thereof and the words of the text units of the text documents, wherein the number of determined association relations between each start word and the words of the text unit is used as a scale for classifying the text document; classifying a text document by accumulating classification values from the text elements; and producing at least one taxonomy tree having taxonomy branches and/or taxonomy nodes or neurons and/or sub-trees and/or taxonomy levels from association relations of the start words, wherein synapse connections between the neurons and/or taxonomy nodes, which can be associated with the start words, are produced in an automated manner, and wherein at least one sub-tree is produced for each start word.</description><language>ger</language><subject>CALCULATING ; COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS ; COMPUTING ; COUNTING ; ELECTRIC DIGITAL DATA PROCESSING ; PHYSICS</subject><creationdate>2012</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20120726&amp;DB=EPODOC&amp;CC=DE&amp;NR=102011009376A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25544,76293</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20120726&amp;DB=EPODOC&amp;CC=DE&amp;NR=102011009376A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>WINKLER, MARIA</creatorcontrib><creatorcontrib>SCHROEDER-BERGEN, ECKART</creatorcontrib><creatorcontrib>HOFMANN, SOLVEIG</creatorcontrib><title>Automatische Klassifikation eines Dokumentenpools mit einem neuronalen System</title><description>Gemäß der Erfindung wird ein Verfahren zur Erzeugung einer Klassifizierung einer Vielzahl von Textdokumenten mittels eines Computers unter Verwendung eines neuronalen Netzes beschrieben, wobei das neuronale Netz eine Vielzahl von vorbestimmbaren Startwörtern aus einem oder mehreren Wörtern aufweist und in mehreren Ebenen strukturiert ist, umfassend die folgenden Schritte: - Einlesen von Textdokumenten mit einer beliebigen Vielzahl von Wörtern in das neuronale Netz; - Bilden eines Primärkontextes wenigstens eines vorbestimmten Startworts aus sämtlichen Assoziationsrelationen, die von dem Startwort ausgehen; - Zuordnen einzelner Texteinheiten der Textdokumente zu den Startbegriffen oder dem Primärkontext; - Erzeugen und/oder Ermitteln von Assoziationsrelationen zwischen einem oder mehreren Startwörtern bzw. ihres Primärkontextes und den Wörtern der Texteinheiten der Textdokumente, wobei die Anzahl der ermittelten Assoziationsrelationen zwischen jedem Startwort und den Wörtern der Texteinheit als Maßstab zum Klassifizieren des Textdokumentes dient; - Klassifizieren eines Texdokumentes durch Kumulieren von Klassifizierungswerten aus den Textelementen; und - Erzeugen wenigstens eines Taxonomiebaums mit Taxonomiezweigen und/oder Taxonomieknoten bzw. Neuronen und/oder Unterbäumen und/oder Taxonomieebobei Synapsenverbindungen zwischen den Neuronen und/oder Taxanomieknoten, welche den Startwörtern zuordenbar sind, in automatisierter Form hergestellt werden und wobei zu jedem Startwort wenigstens ein Unterbaum erzeugt wird. The invention relates to a method for producing a classification of a plurality of text documents by means of a computer using a neural network, wherein the neural network has a plurality of start words that can be predetermined, comprising one or more words, and is structured in several levels. The method comprises the following steps: reading text documents having an arbitrary number of words into the neural network; forming a primary context of at least one predetermined start word from all association relations that proceed from the start word; associating individual text units of the text documents with the start terms or the primary context; producing and/or determining association relations between one or more start words or the primary context thereof and the words of the text units of the text documents, wherein the number of determined association relations between each start word and the words of the text unit is used as a scale for classifying the text document; classifying a text document by accumulating classification values from the text elements; and producing at least one taxonomy tree having taxonomy branches and/or taxonomy nodes or neurons and/or sub-trees and/or taxonomy levels from association relations of the start words, wherein synapse connections between the neurons and/or taxonomy nodes, which can be associated with the start words, are produced in an automated manner, and wherein at least one sub-tree is produced for each start word.</description><subject>CALCULATING</subject><subject>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>PHYSICS</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2012</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNqNirEKwjAURbs4iPoPWRyFxILiWGxFECfdSyi3GJq8F3wvg3-viB_gdOCcM6-uTVFOXoMMD5hL9CJhDNNHMBkEgpiWp5JACsrMUUwK-i3JEMqTyUeQub1EkZbVbPRRsPpxUa1P3f143iBzD8l-AEH7tnN2a52z9lDvd42r__3eCCk4nA</recordid><startdate>20120726</startdate><enddate>20120726</enddate><creator>WINKLER, MARIA</creator><creator>SCHROEDER-BERGEN, ECKART</creator><creator>HOFMANN, SOLVEIG</creator><scope>EVB</scope></search><sort><creationdate>20120726</creationdate><title>Automatische Klassifikation eines Dokumentenpools mit einem neuronalen System</title><author>WINKLER, MARIA ; SCHROEDER-BERGEN, ECKART ; HOFMANN, SOLVEIG</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_DE102011009376A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>ger</language><creationdate>2012</creationdate><topic>CALCULATING</topic><topic>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>PHYSICS</topic><toplevel>online_resources</toplevel><creatorcontrib>WINKLER, MARIA</creatorcontrib><creatorcontrib>SCHROEDER-BERGEN, ECKART</creatorcontrib><creatorcontrib>HOFMANN, SOLVEIG</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>WINKLER, MARIA</au><au>SCHROEDER-BERGEN, ECKART</au><au>HOFMANN, SOLVEIG</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>Automatische Klassifikation eines Dokumentenpools mit einem neuronalen System</title><date>2012-07-26</date><risdate>2012</risdate><abstract>Gemäß der Erfindung wird ein Verfahren zur Erzeugung einer Klassifizierung einer Vielzahl von Textdokumenten mittels eines Computers unter Verwendung eines neuronalen Netzes beschrieben, wobei das neuronale Netz eine Vielzahl von vorbestimmbaren Startwörtern aus einem oder mehreren Wörtern aufweist und in mehreren Ebenen strukturiert ist, umfassend die folgenden Schritte: - Einlesen von Textdokumenten mit einer beliebigen Vielzahl von Wörtern in das neuronale Netz; - Bilden eines Primärkontextes wenigstens eines vorbestimmten Startworts aus sämtlichen Assoziationsrelationen, die von dem Startwort ausgehen; - Zuordnen einzelner Texteinheiten der Textdokumente zu den Startbegriffen oder dem Primärkontext; - Erzeugen und/oder Ermitteln von Assoziationsrelationen zwischen einem oder mehreren Startwörtern bzw. ihres Primärkontextes und den Wörtern der Texteinheiten der Textdokumente, wobei die Anzahl der ermittelten Assoziationsrelationen zwischen jedem Startwort und den Wörtern der Texteinheit als Maßstab zum Klassifizieren des Textdokumentes dient; - Klassifizieren eines Texdokumentes durch Kumulieren von Klassifizierungswerten aus den Textelementen; und - Erzeugen wenigstens eines Taxonomiebaums mit Taxonomiezweigen und/oder Taxonomieknoten bzw. Neuronen und/oder Unterbäumen und/oder Taxonomieebobei Synapsenverbindungen zwischen den Neuronen und/oder Taxanomieknoten, welche den Startwörtern zuordenbar sind, in automatisierter Form hergestellt werden und wobei zu jedem Startwort wenigstens ein Unterbaum erzeugt wird. The invention relates to a method for producing a classification of a plurality of text documents by means of a computer using a neural network, wherein the neural network has a plurality of start words that can be predetermined, comprising one or more words, and is structured in several levels. The method comprises the following steps: reading text documents having an arbitrary number of words into the neural network; forming a primary context of at least one predetermined start word from all association relations that proceed from the start word; associating individual text units of the text documents with the start terms or the primary context; producing and/or determining association relations between one or more start words or the primary context thereof and the words of the text units of the text documents, wherein the number of determined association relations between each start word and the words of the text unit is used as a scale for classifying the text document; classifying a text document by accumulating classification values from the text elements; and producing at least one taxonomy tree having taxonomy branches and/or taxonomy nodes or neurons and/or sub-trees and/or taxonomy levels from association relations of the start words, wherein synapse connections between the neurons and/or taxonomy nodes, which can be associated with the start words, are produced in an automated manner, and wherein at least one sub-tree is produced for each start word.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language ger
recordid cdi_epo_espacenet_DE102011009376A1
source esp@cenet
subjects CALCULATING
COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
PHYSICS
title Automatische Klassifikation eines Dokumentenpools mit einem neuronalen System
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-28T03%3A04%3A12IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=WINKLER,%20MARIA&rft.date=2012-07-26&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EDE102011009376A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true