FACTORY SIMULATION-BASED SCHEDULING SYSTEM USING REINFORCEMENT LEARNING

The present invention relates to a factory simulator-based scheduling system using reinforcement learning, wherein processes in a factory environment, in which products are produced when a workflow including a large number of sequentially related processes is configured and the processes in the work...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: YUN, Young Min, LEE, Ho Yeoul
Format: Patent
Sprache:eng ; fre ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:The present invention relates to a factory simulator-based scheduling system using reinforcement learning, wherein processes in a factory environment, in which products are produced when a workflow including a large number of sequentially related processes is configured and the processes in the workflow are carried out, are scheduled by training a neural network agent that determines the next task action when given the current state of the workflow. The system comprises: a neural network agent having at least one neural network which, when the state of a factory workflow (hereinafter, workflow state) is received, outputs the next task to be carried out in the state, wherein the neural network is trained by a reinforcement learning method; a factory simulator for simulating the factory workflow; and a reinforcement learning module which simulates the factory workflow with the factory simulator, extracts reinforcement learning data from simulation results, and trains the neural network of the neural network agent with the extracted reinforcement learning data. La présente invention porte sur un système de programmation basée sur un simulateur d'usine utilisant l'apprentissage par renforcement. Des processus dans un environnement d'usine, dans lequel des produits sont produits lorsqu'un flux de travail incluant un grand nombre de processus associés séquentiellement est configuré et les processus dans le flux de travail sont mis en œuvre, sont programmés en entraînant un agent de réseau neuronal qui détermine l'action de tâche suivante lorsque l'état actuel du flux de travail lui est donné. Le système comprend : un agent de réseau neuronal ayant au moins un réseau neuronal qui, lorsque l'état d'un flux de travail d'usine (ci-après, état de flux de travail) est reçu, transmet la tâche suivante à mettre en œuvre dans l'état, tel que le réseau neuronal est entraîné par un procédé d'apprentissage de renforcement ; un simulateur d'usine destiné à simuler le flux de travail d'usine ; et un module d'apprentissage de renforcement qui simule le flux de travail d'usine avec le simulateur d'usine, extrait des données d'apprentissage de renforcement à partir de résultats de simulation, et entraîne le réseau neuronal de l'agent de réseau neuronal avec les données d'apprentissage de renforcement extraites. 다수의 공정이 서로 전후 관계를 가지는 워크플로우를 구성하고 워크플로우 상의 공정들이 진행되면 제품이 생산되는 공장 환경에서, 워크플로우의 현재 상태가 주어지면 다음 작업 행위를 결정하는 신경망 에이전트를 학습시켜 공정을 스케줄링하는, 강화 학습을 이용한 공장 시뮬레이터 기반 스케줄링 시스템에 관한 것으