LEARNING PROGRAM, LEARNING METHOD, AND INFORMATION PROCESSING APPARATUS

To shorten a learning time of a natural language processing model.SOLUTION: An information processing apparatus deletes specific types of characters from each of a plurality of sentences and generates a plurality of word strings that do not include the specific types of characters and correspond to...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: DANG DUY THANG
Format: Patent
Sprache:eng ; jpn
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:To shorten a learning time of a natural language processing model.SOLUTION: An information processing apparatus deletes specific types of characters from each of a plurality of sentences and generates a plurality of word strings that do not include the specific types of characters and correspond to the plurality of word strings. The information processing apparatus divides the plurality of word strings into a plurality of groups, each including two or more word strings. The information processing apparatus performs, for each of the plurality of groups, padding to equalize the number of words of the two or more word strings on the basis of the maximum number of words in the two or more word strings. The information processing apparatus updates parameter values included in a natural language processing model for calculating an estimate value from a word string input using each of the plurality of padded groups.SELECTED DRAWING: Figure 6 【課題】自然言語処理モデルの学習時間を短縮する。【解決手段】情報処理装置は、複数の文それぞれから特定の種類の文字を削除して、特定の種類の文字を含まない単語列であって複数の文に対応する複数の単語列を生成する。情報処理装置は、複数の単語列を、2以上の単語列をそれぞれ含む複数のグループに分割する。情報処理装置は、複数のグループそれぞれに対して、2以上の単語列の中の最大単語数に基づいて2以上の単語列の単語数を均一化するパディングを行う。情報処理装置は、パディングが行われた複数のグループそれぞれを用いて、入力された単語列から推定値を算出する自然言語処理モデルに含まれるパラメータ値を更新する。【選択図】図6