WEB DATA EXTRACTION ANALYSIS PROCESSING APPARATUS
The present invention relates to a device for extracting, analyzing, and processing web data. According to the present invention, the device comprises: a SeedURL generation unit automatically generating a uniform resource locator (URL) list in accordance with a predetermined criterion; a parsing inf...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | The present invention relates to a device for extracting, analyzing, and processing web data. According to the present invention, the device comprises: a SeedURL generation unit automatically generating a uniform resource locator (URL) list in accordance with a predetermined criterion; a parsing information providing unit providing a web data terminal with parsing information previously defined for web data regulation; a web data terminal control unit transmitting at least a part of the URL list to the web data terminal, and allowing the web data terminal to extract web data related to a corresponding URL and regulate the web data based on the parsing information to generate normalized data; and an event processing unit processing an event related to a predetermined condition with respect to the normalized data. Accordingly, large scale data collection and monitoring can be distributed and processed with a user terminal.
본 발명은 하는 웹데이터 추출분석처리 장치에 관한 것으로 특정 기준에 따라 URL(Uniform Resource Locator) 리스트를 자동으로 생성하는 SeedURL 생성부, 웹데이터 정규화를 위해 사전에 정의된 파싱(Parsing) 정보를 웹데이터 단말에 제공하는 파싱 정보 제공부, 상기 URL 리스트의 적어도 일부를 상기 웹데이터 단말에 전송하고, 상기 웹데이터 단말이 해당 URL과 연관된 웹데이터를 추출하고 상기 파싱 정보를 기초로 상기 웹데이터의 정규화를 수행하여 정규 데이터를 생성하도록 하는 웹데이터 단말 제어부 및 상기 정규 데이터에 관한 특정 조건과 연관된 이벤트를 처리하는 이벤트 처리부를 포함한다. 따라서, 본 발명은 사용자 단말을 이용하여 대규모 데이터 수집 및 모니터링의 분산처리를 수행할 수 있다. |
---|