Automatische Klassifikation eines Dokumentenpools mit einem neuronalen System

Gemäß der Erfindung wird ein Verfahren zur Erzeugung einer Klassifizierung einer Vielzahl von Textdokumenten mittels eines Computers unter Verwendung eines neuronalen Netzes beschrieben, wobei das neuronale Netz eine Vielzahl von vorbestimmbaren Startwörtern aus einem oder mehreren Wörtern aufweist...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: WINKLER, MARIA, SCHROEDER-BERGEN, ECKART, HOFMANN, SOLVEIG
Format: Patent
Sprache:ger
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Gemäß der Erfindung wird ein Verfahren zur Erzeugung einer Klassifizierung einer Vielzahl von Textdokumenten mittels eines Computers unter Verwendung eines neuronalen Netzes beschrieben, wobei das neuronale Netz eine Vielzahl von vorbestimmbaren Startwörtern aus einem oder mehreren Wörtern aufweist und in mehreren Ebenen strukturiert ist, umfassend die folgenden Schritte: - Einlesen von Textdokumenten mit einer beliebigen Vielzahl von Wörtern in das neuronale Netz; - Bilden eines Primärkontextes wenigstens eines vorbestimmten Startworts aus sämtlichen Assoziationsrelationen, die von dem Startwort ausgehen; - Zuordnen einzelner Texteinheiten der Textdokumente zu den Startbegriffen oder dem Primärkontext; - Erzeugen und/oder Ermitteln von Assoziationsrelationen zwischen einem oder mehreren Startwörtern bzw. ihres Primärkontextes und den Wörtern der Texteinheiten der Textdokumente, wobei die Anzahl der ermittelten Assoziationsrelationen zwischen jedem Startwort und den Wörtern der Texteinheit als Maßstab zum Klassifizieren des Textdokumentes dient; - Klassifizieren eines Texdokumentes durch Kumulieren von Klassifizierungswerten aus den Textelementen; und - Erzeugen wenigstens eines Taxonomiebaums mit Taxonomiezweigen und/oder Taxonomieknoten bzw. Neuronen und/oder Unterbäumen und/oder Taxonomieebobei Synapsenverbindungen zwischen den Neuronen und/oder Taxanomieknoten, welche den Startwörtern zuordenbar sind, in automatisierter Form hergestellt werden und wobei zu jedem Startwort wenigstens ein Unterbaum erzeugt wird. The invention relates to a method for producing a classification of a plurality of text documents by means of a computer using a neural network, wherein the neural network has a plurality of start words that can be predetermined, comprising one or more words, and is structured in several levels. The method comprises the following steps: reading text documents having an arbitrary number of words into the neural network; forming a primary context of at least one predetermined start word from all association relations that proceed from the start word; associating individual text units of the text documents with the start terms or the primary context; producing and/or determining association relations between one or more start words or the primary context thereof and the words of the text units of the text documents, wherein the number of determined association relations between each start word and the words of the text unit is used as a scale for cl