PUBLIC DATA STANDARDIZATION CONVERSION SYSTEM BASED ON COMMON STANDARD TERMS

본 발명의 일 실시예에 따른 공통표준용어 기반 공공데이터 표준화 전환 시스템은, 수집된 공공데이터의 한글컬럼에서 명사를 추출하는 한글컬럼명 조회부; 한글컬럼명과 태깅되는 공통표준용어를 조회하는 공통표준용어 조회부; 한글컬럼명을 조회되는 공통표준용어로 변환하는 공통표준용어 변환부; 조회되는 공통표준용어가 없을 경우 데이터 컬럼 한글명을 토큰화하여 분리하는 한글컬럼 토큰화부; 분리된 한글컬럼명을 표준용어단어 및 행정용어를 기준으로 전환하는 공통표준단어 조회부; 한글컬럼명이 표준용어단어에 존재하는 동음이의어에 해당하는지 판단하는 동음이의...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SHIN DAE WON, JUNG HOE KYUNG
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:본 발명의 일 실시예에 따른 공통표준용어 기반 공공데이터 표준화 전환 시스템은, 수집된 공공데이터의 한글컬럼에서 명사를 추출하는 한글컬럼명 조회부; 한글컬럼명과 태깅되는 공통표준용어를 조회하는 공통표준용어 조회부; 한글컬럼명을 조회되는 공통표준용어로 변환하는 공통표준용어 변환부; 조회되는 공통표준용어가 없을 경우 데이터 컬럼 한글명을 토큰화하여 분리하는 한글컬럼 토큰화부; 분리된 한글컬럼명을 표준용어단어 및 행정용어를 기준으로 전환하는 공통표준단어 조회부; 한글컬럼명이 표준용어단어에 존재하는 동음이의어에 해당하는지 판단하는 동음이의어 판단부; 한글컬럼명이 동음이의어에 해당하는 경우 한글컬럼명의 단어간 유사도를 검사하는 유사도 검사부; 한글컬럼명이 동음이의어에 해당하지 않는 경우 토큰화되어 표준용어로 분리된 한글컬럼명을 조합하는 토큰 조합부; 머신러닝에 사용되는 학습데이터셋을 생성하는 학습데이터셋 생성부; 학습데이터셋을 이용하여 머신러닝을 수행하는 전환 모델부; 및 전환 모델부에서 출력된 학습데이터셋을 저장하는 학습데이터셋 저장부;를 포함할 수 있다.