DEVICE AND METHOD FOR PROVIDING SIMULATION ENVIRONMENT FOR AI AGENT LEARNING

Provided are a device and a method for providing a simulation environment for AI agent learning, capable of training an artificial intelligent (AI) agent by using virtual content. The device for providing the simulation environment includes: a scene object providing module to provide a scene and an...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: JANG SIHWAN, KIM CHAN SUB, YANG SEONG IL
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Provided are a device and a method for providing a simulation environment for AI agent learning, capable of training an artificial intelligent (AI) agent by using virtual content. The device for providing the simulation environment includes: a scene object providing module to provide a scene and an object used in virtual content converted from original content; a reward function providing module to provide a reward function used for the agent to perform reinforcement training in the virtual content; an environment information providing module to provide virtual environment information including information on an environment in which the agent performs the reinforcement training in the virtual content; a state information providing module to provide virtual state information for indicating the state of the agent in the virtual content; an action space providing module to provide a virtual action space for indicating an action of the agent in the virtual content; and a virtual training module to generate a simulation environment based on at least one of the scene, the object, the reward function, the virtual environment information, the virtual state information, and the virtual action space, and to perform virtual training for the agent under the simulation environment. 인공지능 에이전트 학습을 위한 모의 실험 환경 제공 장치 및 방법이 제공된다. 모의 실험 환경 제공 장치는, 원본 컨텐츠로부터 변환된 가상 컨텐츠에서 사용되는 장면(scene) 및 객체(object)를 제공하는 장면 객체 제공 모듈; 가상 컨텐츠에서 에이전트(agent)가 강화 학습을 수행하기 위해 사용되는 보상함수(reward function)를 제공하는 보상함수 제공 모듈; 가상 컨텐츠에서 에이전트가 강화 학습을 수행하기 위한 환경(environment)에 관한 정보를 포함하는 가상 환경정보를 제공하는 환경정보 제공 모듈; 가상 컨텐츠에서의 에이전트의 상태(state)를 나타내는 가상 상태정보를 제공하는 상태정보 제공 모듈; 가상 컨텐츠에서의 에이전트의 행동(action)을 나타내는 가상 행동공간을 제공하는 행동공간 제공 모듈; 및 장면, 객체, 보상함수, 가상 환경정보, 가상 상태정보 및 가상 행동공간 중 적어도 하나에 기초하여 모의 실험 환경을 생성하고, 모의 실험 환경에서 에이전트에 대한 가상학습을 수행하는 가상학습 모듈을 포함한다.