DOCUMENT PROCESSING DEVICE, DOCUMENT PROCESSING METHOD AND PROGRAM

PROBLEM TO BE SOLVED: To generate a document vector with dependency structure between words appearing in the document reflected.SOLUTION: An importance matrix generation unit in a document processing device generates an importance matrix with respect to a document to be processed. This importance ma...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MATSUNAGA TSUTOMU, HARA MASAMI
Format: Patent
Sprache:eng ; jpn
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:PROBLEM TO BE SOLVED: To generate a document vector with dependency structure between words appearing in the document reflected.SOLUTION: An importance matrix generation unit in a document processing device generates an importance matrix with respect to a document to be processed. This importance matrix, which is a matrix in which each word constituting a dependency relation extracted from a document set is associated with a row and a column, is a matrix in which importance of the dependency relation is assigned as a component corresponding to a row of a dependency origin word and a column of a dependency destination constituting the dependency relation with respect to each dependency relation specified in the document to be processed. A document vector generation unit concatenates each row vector in the generated importance matrix to generate a document vector.SELECTED DRAWING: Figure 1 【課題】文書中に出現する単語間の係り受け構造を反映した文書ベクトルを生成する。【解決手段】文書処理装置の重要度行列生成部は、処理対象の文書について重要度行列を生成する。この重要度行列は、文書集合から抽出された係り受け関係を構成する各単語が行及び列に対応付けられた行列であって、処理対象の文書において特定された各係り受け関係について、係り受け関係を構成する係り元の単語の行と係り先の列に対応する成分として当該係り受け関係の重要度が割り当てられた行列である。文書ベクトル生成部は、生成された重要度行列の各行ベクトルを連結して文書ベクトルを生成する。【選択図】図1