CHECKING METHOD OF WEB PAGES FOR CONTENT IN THEM OF TARGET AUDIO AND/OR VIDEO (AV) CONTENT OF REAL TIME
FIELD: information technology.SUBSTANCE: checking method of web pages for content in them of target content, which involves quick analysis of web pages by means of an analysis of an initial code of a web page for presence in it of basic features demonstrating availability on web pages of a target co...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; rus |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | FIELD: information technology.SUBSTANCE: checking method of web pages for content in them of target content, which involves quick analysis of web pages by means of an analysis of an initial code of a web page for presence in it of basic features demonstrating availability on web pages of a target content, and formation of a key of the detected features; a deep analysis of web pages associated with the key for availability in them of target content by execution of a program code, loading of objects and connection to media servers, loading and analysis of technical and meta information from flows, depending on presence in it or absence from it of target content; with that, for each key and feature there determined is effectiveness index based on statistical information on number and status of checked web pages. Obtained effectiveness indexes are used at stages of quick and deep analysis, thus allowing to apply a resource-intensive deep analysis only to web pages having high probability of availability of target content.EFFECT: improving efficient detection of target content contained in checked web pages.52 cl, 9 ex, 4 dwg
Изобретение относится к компьютерной технике, а именно, к технологиям, используемым для выявления целевого контента в виде аудио и/или видео потоков, вещание которых осуществляется в масштабе реального времени. Технический результат - повышение эффективности обнаружения целевого контента, содержащегося в проверяемых веб-страницах. Способ проверки веб-страниц на содержание в них целевого контента, включающий быстрый анализ веб-страниц посредством анализа исходного кода веб-страницы на предмет присутствия в нем базовых признаков, свидетельствующих о наличии на веб-страницах целевого контента, и формирование ключа из обнаруженных признаков; глубокий анализ ассоциированных с ключом веб-страниц на наличие в них целевого контента посредством исполнения программного кода, загрузки объектов и подключения к медиа серверам, загрузке и анализу технической и мета-информации из потоков, и присваивание веб-страницам статуса, в зависимости от наличия или отсутствия в ней целевого контента, при этом каждому ключу и признаку определяют показатель результативности на основе статистической информации о количестве и статусе проверенных веб-страниц. Полученные показатели результативности используются на этапах быстрого и глубокого анализа, позволяя применять ресурсоемкий глубокий анализ только к веб-страницам, имеющим высокую вероятность наличия целевого конте |
---|