Q- self-supervised learning METHODS FOR PERFORMING SELF-SUPERVISED LEARNING OF DEEP-LEARNING BASED DETECTION NETWORK BY USING DEEP Q-NETWORK AND DEVICES USING THE SAME
Disclosed are a method for learning a deep Q-network using a transition vector, and a device using the same. According to the method for self-supervised learning of a deep learning-based detection network using a deep Q-network, object detection on a first unlabeled image through the detection netwo...
Gespeichert in:
Hauptverfasser: | , , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Disclosed are a method for learning a deep Q-network using a transition vector, and a device using the same. According to the method for self-supervised learning of a deep learning-based detection network using a deep Q-network, object detection on a first unlabeled image through the detection network learned with a learning database is performed to generate first object detection information and a running operation on a first state set corresponding to the first object detection information through the deep Q-network is performed to generate a Q-value. When the Q-Value action corresponds to the acceptance of the first unlabeled image, the relearned detection network is tested by using the learning database to which a labeled image of the first unlabeled image is added as learning data to generate a first accuracy. When the action corresponds to the rejection of the first unlabeled image, the detection network is tested without relearning to generate a second accuracy and the first state set, the action, the reward for the first accuracy or the second accuracy, and a second state set of the second unlabeled image are generated as a transition vector. The present invention has the effect of effectively selecting optimal learning data which can increase the accuracy of the detection network using the Q-value generated by the deep Q-network.
딥 Q-네트워크를 이용하여 딥러닝 기반의 디텍션 네트워크(detection network)를 자기지도학습(self-supervised learning)하는 방법에 있어서, 학습 데이터베이스로 학습된 상기 디텍션 네트워크를 통해 제1 언라벨드 이미지에 대한 오브젝트 디텍션을 수행하여 제1 오브젝트 디텍션 정보를 생성하고, 상기 딥 Q-네트워크를 통해 상기 제1 오브젝트 디텍션 정보에 대응하는 제1 스테이트 셋(state set)을 러닝 연산하여 Q-Value를 생성하며, Q-Value의 액션이 상기 제1 언라벨드 이미지의 억셉턴스(acceptance)에 대응될 경우, 상기 제1 언라벨드 이미지의 라벨드 이미지(labeled image)를 학습 데이터로 추가한 상기 학습 데이터베이스를 이용하여 재학습된 상기 디텍션 네트워크를 테스트하여 제1 정확도(accuracy)를 생성하고, 상기 액션이 상기 제1 언라벨드 이미지의 리젝션(rejection)에 대응될 경우, 상기 디텍션 네트워크를 재학습 없이 테스트하여 제2 정확도를 생성하며, 상기 제1 스테이트 셋, 상기 액션, 상기 제1 정확도나 상기 제2 정확도에 대한 리워드 및 제2 언라벨드 이미지의 제2 스테이트 셋을 트랜지션 벡터(transition vector)로 생성하고, 상기 딥 Q-네트워크를 상기 트랜지션 벡터를 이용하는 학습시키는 방법 및 이를 이용한 장치가 개시된다. |
---|