DATA PROCESSING METHOD BASED-ON ENTROPY VALUE OF DATA

Provided are a data processing method for generating an entropy table based on an entropy value with respect to source data to use the entropy table for increasing the sampling accuracy for the source data, and a data preparation method for analyzing the source data using a result of the data proces...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: HWANG HEE JUNG, JI YOUNG JOON, CHO GYEONG SEON, JEONG TAE HWAN, SON SUK MIN, JIN YU RI
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Provided are a data processing method for generating an entropy table based on an entropy value with respect to source data to use the entropy table for increasing the sampling accuracy for the source data, and a data preparation method for analyzing the source data using a result of the data processing. According to one embodiment of the present invention, the data processing method comprises the steps of: obtaining the source data including records having a plurality of columns; calculating an entropy value for each column of the source data; selecting a key element column among the plurality of columns based on the entropy value; and generating an entropy table of the source data using an index key composed using values of the selected key element column. 소스 데이터에 대하여 그 엔트로피 값을 기준으로 엔트로피 테이블을 생성하여, 상기 소스 데이터에 대한 샘플링 정확도를 높이는 등의 용도로 사용하는 데이터 프로세싱 방법 및 상기 데이터 프로세싱의 결과를 이용하여 상기 소스 데이터의 분석에 제공될 데이터의 준비(data preparation) 방법이 제공된다. 본 발명의 일 실시예에 따른 데이터 프로세싱 방법은, 복수의 컬럼을 가지는 레코드들을 포함하는 상기 소스 데이터를 얻는 단계와, 상기 소스 데이터의 각 컬럼 별 엔트로피 값을 계산하는 단계와, 상기 엔트로피 값을 기준으로 상기 복수의 컬럼 중 키 요소 컬럼을 선정하는 단계와, 상기 선정된 키 요소 컬럼의 값들을 이용하여 구성된 인덱스 키를 이용하여 상기 소스 데이터의 엔트로피 테이블을 생성하는 단계를 포함한다.