NEURAL NETWORK-BASED FILE MANAGEMENT SYSTEM

Embodiments provide a file management method based on a neural network. A file management method according to an embodiment may include: receiving, by a server transceiver, a first document from a client storing a plurality of documents including a first document and a second document; extracting a...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: JEONG JIN YONG, GWON O HUN, AN IN KYUNG, KO WON SEOK, KIM GEUN HO, SHIN HYE SU, LIM MIN GYU
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Embodiments provide a file management method based on a neural network. A file management method according to an embodiment may include: receiving, by a server transceiver, a first document from a client storing a plurality of documents including a first document and a second document; extracting a text file based on text data included in the first document by a data classifier; extracting an image file based on image data included in the first document; extracting, by an image extraction module, one or more feature images from the image file; generating a feature code by clustering the one or more feature images; extracting one or more first keywords based on the feature code; extracting, by a text extraction module, one or more second keywords from the text file using a TF-IDF method; and comparing, by a category classifier, a first category stored in a database with the one or more first keywords and the one or more second keywords to determine a category of the first document. It is possible to effectively manage documents stored in multiple clients. 실시예들은 뉴럴 네트워크 기반의 파일 매니지먼트 방법을 제공한다. 실시예에 따른 파일 매니지먼트 방법은, 서버 트랜시버에 의해, 제1 문서, 제2 문서를 포함하는 복수의 문서를 저장하는 클라이언트로부터 상기 제1 문서를 제공받고, 데이터 분류기에 의해, 상기 제1 문서에 포함된 텍스트 데이터를 기초로 텍스트 파일을 추출하고, 상기 제1 문서에 포함된 이미지 데이터를 기초로 이미지 파일을 추출하고, 이미지 추출 모듈에 의해, 상기 이미지 파일에서 하나 이상의 특징 이미지를 추출하고, 상기 하나 이상의 특징 이미지를 군집화(clustering)하여 특징 코드를 생성하고, 상기 특징 코드를 기초로 하나 이상의 제1 키워드를 추출하고, 텍스트 추출 모듈에 의해, 상기 텍스트 파일에서 TF-IDF방식을 이용하여 하나 이상의 제2 키워드를 추출하고, 카테고리 분류기에 의해, 데이터베이스에 저장된 제1 카테고리와 상기 하나 이상의 제1 키워드와, 상기 하나 이상의 제2 키워드를 비교하여 상기 제1 문서의 카테고리를 결정하는 것을 포함할 수 있다.