SUPPORT SYSTEM, SUPPORT METHOD, AND SUPPORT PROGRAM

An input means 81 receives input of observation data observed in association with operation of a device, and input of a cost function in which the factors of the behavior intended by the operator of the device are explanatory variables. A learning means 82 generates the cost function through inverse...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ETO Riki, CHIBA Yuki, OI Norihito
Format: Patent
Sprache:eng ; fre ; jpn
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:An input means 81 receives input of observation data observed in association with operation of a device, and input of a cost function in which the factors of the behavior intended by the operator of the device are explanatory variables. A learning means 82 generates the cost function through inverse reinforcement learning using the observation data. A distribution map generation means 83 extracts the weights of the explanatory variables of the generated cost function as feature quantities representing the intention of the operator, and generates a distribution map in which information relating to the cost function is positioned at corresponding positions according to the extracted feature quantities in a multidimensional space having dimensional axes representing the explanatory variables. Un moyen d'entrée 81 reçoit une entrée de données d'observation observées en association avec l'exploitation d'un dispositif, et une entrée d'une fonction coût dans laquelle les facteurs du comportement voulu par l'opérateur du dispositif sont des variables explicatives. Un moyen d'apprentissage 82 génère la fonction coût par apprentissage par renforcement inverse à l'aide des données d'observation. Un moyen de génération de carte de distribution 83 extrait les poids des variables explicatives de la fonction coût générée à titre de grandeurs caractéristiques représentant l'intention de l'opérateur, et génère une carte de distribution dans laquelle des informations relatives à la fonction coût sont positionnées à des positions correspondantes selon les grandeurs caractéristiques extraites dans un espace multidimensionnel ayant des axes dimensionnels représentant les variables explicatives. 入力手段81は、機器の操作に付随して観測される観測データの入力、および、その機器の操作者が意図する行動の要因を説明変数とするコスト関数の入力を受け付ける。学習手段82は、観測データを用いた逆強化学習により、コスト関数を生成する。分布図生成手段83は、生成されたコスト関数の説明変数の重みを操作者の意図を表わす特徴量として抽出し、抽出されたその特徴量に応じて、説明変数を次元軸とする多次元空間上において対応する位置にコスト関数に関する情報を配置した分布図を生成する。