LEARNING DEVICE, ESTIMATION DEVICE, TRAINING METHOD, ESTIMATION METHOD, TRAINING PROGRAM, AND ESTIMATION PROGRAM

A learning device (100) comprises: an acquisition unit (120) that acquires an important word dictionary (111) which is information indicating important words, a conversion table (112) which is used for converting morphemes, and text which indicates character strings; a pre-processing unit (130) that...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: AIKAWA Takeyuki, YOSHIDA Michinori, ITO Daishin
Format: Patent
Sprache:eng ; fre ; jpn
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A learning device (100) comprises: an acquisition unit (120) that acquires an important word dictionary (111) which is information indicating important words, a conversion table (112) which is used for converting morphemes, and text which indicates character strings; a pre-processing unit (130) that divides the character strings indicated by the text into a plurality of morphemes and uses the important word dictionary (111) to attach tags to the morphemes corresponding to the important words among the plurality of morphemes; a conversion unit (140) that converts the morphemes corresponding to the important words into different morphemes on the basis of the conversion table (112); and a generation unit (150) that generates a trained model which estimates important words among the character strings using training data including the converted morphemes and the morphemes to which the tags indicating the important words among the plurality of morphemes are not attached. L'invention concerne un dispositif d'apprentissage (100) qui comprend : une unité d'acquisition (120) qui acquiert un dictionnaire de mots importants (111) qui constitue des informations indiquant des mots importants, une table de conversion (112) qui est utilisée pour convertir des morphèmes, et un texte qui indique des chaînes de caractères ; une unité de prétraitement (130) qui divise les chaînes de caractères indiquées par le texte en une pluralité de morphèmes et qui utilise le dictionnaire de mots importants (111) pour fixer des étiquettes aux morphèmes correspondant aux mots importants parmi la pluralité de morphèmes ; une unité de conversion (140) qui convertit les morphèmes correspondant aux mots importants en différents morphèmes sur la base de la table de conversion (112) ; et une unité de génération (150) qui génère un modèle formé qui estime des mots importants parmi les chaînes de caractères à l'aide de données d'entraînement comprenant les morphèmes convertis et les morphèmes auxquels les étiquettes indiquant les mots importants parmi la pluralité de morphèmes ne sont pas attachées. 学習装置(100)は、重要語を示す情報である重要語辞書(111)、形態素を変換するための変換テーブル(112)、及び文字列を示すテキストを取得する取得部(120)と、テキストが示す文字列を複数の形態素に分割し、重要語辞書(111)を用いて、複数の形態素の中で重要語に対応する形態素にタグを付ける前処理部(130)と、変換テーブル(112)に基づいて、重要語に対応する形態素を、異なる形態素に変換する変換部(140)と、複数の形態素の中で重要語であることを示すタグが付されていない形態素と、変換された形態素とを含む学習データを用いて、文字列の中から重要語を推定する学習済モデルを生成する生成部(150)と、を有する。