LEARNING METHOD, LEARNING DEVICE, LEARNING SYSTEM, AND PROGRAM

The present invention is characterized in that a computer executes, on the basis of an action plan that is outputted by a first model and that is a plan for an operation performed by a virtual robot in a simulated environment, a procedure for training a second model by reinforcement learning, the se...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MASUDA, Shimpei, TAKAHASHI, Kuniyuki
Format: Patent
Sprache:eng ; fre ; jpn
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator MASUDA, Shimpei
TAKAHASHI, Kuniyuki
description The present invention is characterized in that a computer executes, on the basis of an action plan that is outputted by a first model and that is a plan for an operation performed by a virtual robot in a simulated environment, a procedure for training a second model by reinforcement learning, the second model outputting a control value of an actual-environment robot in an actual environment in which the operation can be implemented. La présente invention est caractérisée en ce qu'un ordinateur exécute, sur la base d'un plan d'action qui est délivré par un premier modèle et qui est un plan pour une opération effectuée par un robot virtuel dans un environnement simulé, une procédure pour former un second modèle par apprentissage de renfort, le second modèle délivrant une valeur de commande d'un robot d'environnement réel dans un environnement réel dans lequel l'opération peut être mise en oeuvre. 第1のモデルが出力した、シミュレーション環境における仮想ロボットによる動作の行動計画に基づいて、前記動作を実現可能な実環境における実環境のロボットの制御値を出力する第2のモデルを強化学習により訓練する手順、をコンピュータが実行することを特徴とする。
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2020009139A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2020009139A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2020009139A13</originalsourceid><addsrcrecordid>eNrjZLDzcXUM8vP0c1fwdQ3x8HfRUYALuLiGeTq7IgkERwaHuPrqKDj6uSgEBPm7Bzn68jCwpiXmFKfyQmluBmU31xBnD93Ugvz41OKCxOTUvNSS-HB_IwMjAwMDS0NjS0dDY-JUAQDR_Cqe</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>LEARNING METHOD, LEARNING DEVICE, LEARNING SYSTEM, AND PROGRAM</title><source>esp@cenet</source><creator>MASUDA, Shimpei ; TAKAHASHI, Kuniyuki</creator><creatorcontrib>MASUDA, Shimpei ; TAKAHASHI, Kuniyuki</creatorcontrib><description>The present invention is characterized in that a computer executes, on the basis of an action plan that is outputted by a first model and that is a plan for an operation performed by a virtual robot in a simulated environment, a procedure for training a second model by reinforcement learning, the second model outputting a control value of an actual-environment robot in an actual environment in which the operation can be implemented. La présente invention est caractérisée en ce qu'un ordinateur exécute, sur la base d'un plan d'action qui est délivré par un premier modèle et qui est un plan pour une opération effectuée par un robot virtuel dans un environnement simulé, une procédure pour former un second modèle par apprentissage de renfort, le second modèle délivrant une valeur de commande d'un robot d'environnement réel dans un environnement réel dans lequel l'opération peut être mise en oeuvre. 第1のモデルが出力した、シミュレーション環境における仮想ロボットによる動作の行動計画に基づいて、前記動作を実現可能な実環境における実環境のロボットの制御値を出力する第2のモデルを強化学習により訓練する手順、をコンピュータが実行することを特徴とする。</description><language>eng ; fre ; jpn</language><subject>CALCULATING ; CHAMBERS PROVIDED WITH MANIPULATION DEVICES ; COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS ; COMPUTING ; COUNTING ; HAND TOOLS ; MANIPULATORS ; PERFORMING OPERATIONS ; PHYSICS ; PORTABLE POWER-DRIVEN TOOLS ; TRANSPORTING</subject><creationdate>2020</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20200109&amp;DB=EPODOC&amp;CC=WO&amp;NR=2020009139A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25542,76289</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20200109&amp;DB=EPODOC&amp;CC=WO&amp;NR=2020009139A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>MASUDA, Shimpei</creatorcontrib><creatorcontrib>TAKAHASHI, Kuniyuki</creatorcontrib><title>LEARNING METHOD, LEARNING DEVICE, LEARNING SYSTEM, AND PROGRAM</title><description>The present invention is characterized in that a computer executes, on the basis of an action plan that is outputted by a first model and that is a plan for an operation performed by a virtual robot in a simulated environment, a procedure for training a second model by reinforcement learning, the second model outputting a control value of an actual-environment robot in an actual environment in which the operation can be implemented. La présente invention est caractérisée en ce qu'un ordinateur exécute, sur la base d'un plan d'action qui est délivré par un premier modèle et qui est un plan pour une opération effectuée par un robot virtuel dans un environnement simulé, une procédure pour former un second modèle par apprentissage de renfort, le second modèle délivrant une valeur de commande d'un robot d'environnement réel dans un environnement réel dans lequel l'opération peut être mise en oeuvre. 第1のモデルが出力した、シミュレーション環境における仮想ロボットによる動作の行動計画に基づいて、前記動作を実現可能な実環境における実環境のロボットの制御値を出力する第2のモデルを強化学習により訓練する手順、をコンピュータが実行することを特徴とする。</description><subject>CALCULATING</subject><subject>CHAMBERS PROVIDED WITH MANIPULATION DEVICES</subject><subject>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>HAND TOOLS</subject><subject>MANIPULATORS</subject><subject>PERFORMING OPERATIONS</subject><subject>PHYSICS</subject><subject>PORTABLE POWER-DRIVEN TOOLS</subject><subject>TRANSPORTING</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2020</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZLDzcXUM8vP0c1fwdQ3x8HfRUYALuLiGeTq7IgkERwaHuPrqKDj6uSgEBPm7Bzn68jCwpiXmFKfyQmluBmU31xBnD93Ugvz41OKCxOTUvNSS-HB_IwMjAwMDS0NjS0dDY-JUAQDR_Cqe</recordid><startdate>20200109</startdate><enddate>20200109</enddate><creator>MASUDA, Shimpei</creator><creator>TAKAHASHI, Kuniyuki</creator><scope>EVB</scope></search><sort><creationdate>20200109</creationdate><title>LEARNING METHOD, LEARNING DEVICE, LEARNING SYSTEM, AND PROGRAM</title><author>MASUDA, Shimpei ; TAKAHASHI, Kuniyuki</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2020009139A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre ; jpn</language><creationdate>2020</creationdate><topic>CALCULATING</topic><topic>CHAMBERS PROVIDED WITH MANIPULATION DEVICES</topic><topic>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>HAND TOOLS</topic><topic>MANIPULATORS</topic><topic>PERFORMING OPERATIONS</topic><topic>PHYSICS</topic><topic>PORTABLE POWER-DRIVEN TOOLS</topic><topic>TRANSPORTING</topic><toplevel>online_resources</toplevel><creatorcontrib>MASUDA, Shimpei</creatorcontrib><creatorcontrib>TAKAHASHI, Kuniyuki</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>MASUDA, Shimpei</au><au>TAKAHASHI, Kuniyuki</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>LEARNING METHOD, LEARNING DEVICE, LEARNING SYSTEM, AND PROGRAM</title><date>2020-01-09</date><risdate>2020</risdate><abstract>The present invention is characterized in that a computer executes, on the basis of an action plan that is outputted by a first model and that is a plan for an operation performed by a virtual robot in a simulated environment, a procedure for training a second model by reinforcement learning, the second model outputting a control value of an actual-environment robot in an actual environment in which the operation can be implemented. La présente invention est caractérisée en ce qu'un ordinateur exécute, sur la base d'un plan d'action qui est délivré par un premier modèle et qui est un plan pour une opération effectuée par un robot virtuel dans un environnement simulé, une procédure pour former un second modèle par apprentissage de renfort, le second modèle délivrant une valeur de commande d'un robot d'environnement réel dans un environnement réel dans lequel l'opération peut être mise en oeuvre. 第1のモデルが出力した、シミュレーション環境における仮想ロボットによる動作の行動計画に基づいて、前記動作を実現可能な実環境における実環境のロボットの制御値を出力する第2のモデルを強化学習により訓練する手順、をコンピュータが実行することを特徴とする。</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre ; jpn
recordid cdi_epo_espacenet_WO2020009139A1
source esp@cenet
subjects CALCULATING
CHAMBERS PROVIDED WITH MANIPULATION DEVICES
COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
COMPUTING
COUNTING
HAND TOOLS
MANIPULATORS
PERFORMING OPERATIONS
PHYSICS
PORTABLE POWER-DRIVEN TOOLS
TRANSPORTING
title LEARNING METHOD, LEARNING DEVICE, LEARNING SYSTEM, AND PROGRAM
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-02-08T12%3A06%3A37IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=MASUDA,%20Shimpei&rft.date=2020-01-09&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2020009139A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true