APPARATUS AND METHOD FOR DETECTION OF SPECIFIC INFORMATION INCLUDED IN FILE RECORDING MEDIUM THEREOF
The present invention provides an apparatus for detection of specific information included in a file, and a method therefor. The apparatus includes: a receiving unit for receiving a document file from a user terminal; a conversion file generating unit for generating a conversion file by converting t...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | The present invention provides an apparatus for detection of specific information included in a file, and a method therefor. The apparatus includes: a receiving unit for receiving a document file from a user terminal; a conversion file generating unit for generating a conversion file by converting the document file received by the receiving unit into an image page in which RGB information is present for each pixel over every page; a storage unit for storing a plurality of image pages and a label indicating whether specific information is included in each image page, as label information; a learning unit for optimizing a pre-stored algorithm to determine whether the specific information is included in an arbitrary image page while learning the label information using the algorithm; a determining unit for determining whether the specific information is included in the image page of the converted file by using the algorithm optimized through the learning unit; and a providing unit for providing the document file to another user terminal when the determining unit determines that the specific information is not included in the converted file.
본 발명은 사용자 단말기로부터 문서파일을 수신하는 수신부; 상기 수신부에서 수신한 문서파일을 페이지마다 RGB정보가 픽셀별로 존재하는 이미지 페이지로 변환하여 변환파일을 생성하는 변환파일 생성부; 다수개의 이미지 페이지 및 각각의 이미지 페이지 내 특정정보 포함 유무에 대한 레이블이 레이블정보로 저장된 저장부; 기 저장된 알고리즘을 이용해 상기 레이블정보를 학습하면서 임의의 이미지 페이지 내에 특정정보 포함 유무 판단이 이루어지도록 상기 알고리즘을 최적화(optimization)하는 학습부; 상기 학습부를 통해 최적화된 알고리즘을 이용하여 상기 변환파일의 이미지 페이지 내 특정정보 포함 유무를 판단하는 판단부; 및 상기 판단부에서 상기 변환파일 내 특정정보가 포함되지 않았음을 판단한 경우에 상기 문서파일을 또 다른 사용자 단말기에 제공하는 제공부;를 포함하는 파일 내 포함된 특정정보 탐지장치 및 이에 의한 파일 내 포함된 특정정보 탐지 방법을 제공한다. |
---|