METHOD FOR MACHINE LEARNING AND APPARATUS FOR THE SAME

Provided is a machine learning method capable of reducing annotation cost and improving the performance of a target model. The machine learning method according to embodiments of the present information, which is performed by a computing device, can comprise the steps of: obtaining a training datase...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: PARK SUNG GYUN, YOO DONG GEUN, PAENG KYUNG HYUN
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Provided is a machine learning method capable of reducing annotation cost and improving the performance of a target model. The machine learning method according to embodiments of the present information, which is performed by a computing device, can comprise the steps of: obtaining a training dataset of a first model including a plurality of data samples for which label information is not given; calculating a miss-prediction probability of the first model for the plurality of data samples; selecting at least one data sample from the plurality of data samples based on the calculated miss-prediction probability to form a first data sample set; obtaining first label information for the first data sample set; and performing first training on the first model by using the first data sample set and the first label information. 어노테이션 비용을 줄이고 타깃 모델의 성능을 개선할 수 있는 기계 학습 방법이 제공된다. 컴퓨팅 장치에 수행되는 본 개시의 몇몇 실시예들에 따른 기계 학습 방법은, 레이블 정보가 주어지지 않은 복수의 데이터 샘플을 포함하는 제1 모델의 학습 데이터셋을 획득하는 단계, 상기 복수의 데이터 샘플에 대하여 상기 제1 모델의 오예측(miss-prediction) 확률을 산출하는 단계, 상기 산출된 오예측 확률을 기초로 상기 복수의 데이터 샘플 중 적어도 하나의 데이터 샘플을 선별하여 제1 데이터 샘플 집합을 구성하는 단계, 상기 제1 데이터 샘플 집합에 대한 제1 레이블 정보를 획득하는 단계 및 상기 제1 데이터 샘플 집합과 상기 제1 레이블 정보를 이용하여 상기 제1 모델에 대한 제1 학습을 수행하는 단계를 포함할 수 있다.