MULTI-TIERED CASCADING CRAWLING SYSTEM

Provided is a multi-tiered cascading crawling system for finding on a network information related to one or more predetermined topics or subtopics of interest. In general, embodiments of the present invention provide a system that operates in multiple "tiers," where at least some of the ou...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MOORE, MATTHEW, WHITLEY, SEAN, ZHANG, ZHE, PIASECZNY, WOJTEK, DUFFY, PAUL, DETUNO, JOE
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator MOORE, MATTHEW
WHITLEY, SEAN
ZHANG, ZHE
PIASECZNY, WOJTEK
DUFFY, PAUL
DETUNO, JOE
description Provided is a multi-tiered cascading crawling system for finding on a network information related to one or more predetermined topics or subtopics of interest. In general, embodiments of the present invention provide a system that operates in multiple "tiers," where at least some of the output of one tier is used to comprise the input of the next tier. Each tier generally analyzes collections of documents on the network using successively more restrictive criteria about the subject matter of each collection and/or about which collections may be related to the one or more topics or subtopics. In general, only the final tier performs an exhaustive crawl of all of the documents of the collections that are identified by the system as being relevant to the topic or subtopic of interest. L'invention concerne un système de balayage en cascade multiniveau, qui est destiné à trouver, sur un réseau, des informations relatives à un ou plusieurs sujets ou sous-sujets d'intérêt prédéterminés. En général, des modes de réalisation ont trait à un système qui fonctionne dans des niveaux multiples, au moins une partie de la sortie d'un niveau constituant l'entrée du niveau suivant. Chaque niveau analyse globalement des collections de documents sur le réseau, à l'aide de critères de plus en plus restrictifs concernant la matière traitée dans chaque collection et/ou définissant quelles sont les collections qui peuvent être associées à un ou plusieurs sujets ou sous-sujets. En général, seul le niveau final effectue un balayage exhaustif de tous les documents des collections qui sont identifiées par le système comme étant pertinentes pour le sujet ou le sous-sujet d'intérêt.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2008046098A2</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2008046098A2</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2008046098A23</originalsourceid><addsrcrecordid>eNrjZFDzDfUJ8dQN8XQNcnVRcHYMdnZ08fRzV3AOcgz3ATGCI4NDXH15GFjTEnOKU3mhNDeDsptriLOHbmpBfnxqcUFicmpeakl8uL-RgYGFgYmZgaWFo5ExcaoAWScklw</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>MULTI-TIERED CASCADING CRAWLING SYSTEM</title><source>esp@cenet</source><creator>MOORE, MATTHEW ; WHITLEY, SEAN ; ZHANG, ZHE ; PIASECZNY, WOJTEK ; DUFFY, PAUL ; DETUNO, JOE</creator><creatorcontrib>MOORE, MATTHEW ; WHITLEY, SEAN ; ZHANG, ZHE ; PIASECZNY, WOJTEK ; DUFFY, PAUL ; DETUNO, JOE</creatorcontrib><description>Provided is a multi-tiered cascading crawling system for finding on a network information related to one or more predetermined topics or subtopics of interest. In general, embodiments of the present invention provide a system that operates in multiple "tiers," where at least some of the output of one tier is used to comprise the input of the next tier. Each tier generally analyzes collections of documents on the network using successively more restrictive criteria about the subject matter of each collection and/or about which collections may be related to the one or more topics or subtopics. In general, only the final tier performs an exhaustive crawl of all of the documents of the collections that are identified by the system as being relevant to the topic or subtopic of interest. L'invention concerne un système de balayage en cascade multiniveau, qui est destiné à trouver, sur un réseau, des informations relatives à un ou plusieurs sujets ou sous-sujets d'intérêt prédéterminés. En général, des modes de réalisation ont trait à un système qui fonctionne dans des niveaux multiples, au moins une partie de la sortie d'un niveau constituant l'entrée du niveau suivant. Chaque niveau analyse globalement des collections de documents sur le réseau, à l'aide de critères de plus en plus restrictifs concernant la matière traitée dans chaque collection et/ou définissant quelles sont les collections qui peuvent être associées à un ou plusieurs sujets ou sous-sujets. En général, seul le niveau final effectue un balayage exhaustif de tous les documents des collections qui sont identifiées par le système comme étant pertinentes pour le sujet ou le sous-sujet d'intérêt.</description><language>eng ; fre</language><subject>CALCULATING ; COMPUTING ; COUNTING ; ELECTRIC DIGITAL DATA PROCESSING ; PHYSICS</subject><creationdate>2008</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20080417&amp;DB=EPODOC&amp;CC=WO&amp;NR=2008046098A2$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,780,885,25564,76547</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20080417&amp;DB=EPODOC&amp;CC=WO&amp;NR=2008046098A2$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>MOORE, MATTHEW</creatorcontrib><creatorcontrib>WHITLEY, SEAN</creatorcontrib><creatorcontrib>ZHANG, ZHE</creatorcontrib><creatorcontrib>PIASECZNY, WOJTEK</creatorcontrib><creatorcontrib>DUFFY, PAUL</creatorcontrib><creatorcontrib>DETUNO, JOE</creatorcontrib><title>MULTI-TIERED CASCADING CRAWLING SYSTEM</title><description>Provided is a multi-tiered cascading crawling system for finding on a network information related to one or more predetermined topics or subtopics of interest. In general, embodiments of the present invention provide a system that operates in multiple "tiers," where at least some of the output of one tier is used to comprise the input of the next tier. Each tier generally analyzes collections of documents on the network using successively more restrictive criteria about the subject matter of each collection and/or about which collections may be related to the one or more topics or subtopics. In general, only the final tier performs an exhaustive crawl of all of the documents of the collections that are identified by the system as being relevant to the topic or subtopic of interest. L'invention concerne un système de balayage en cascade multiniveau, qui est destiné à trouver, sur un réseau, des informations relatives à un ou plusieurs sujets ou sous-sujets d'intérêt prédéterminés. En général, des modes de réalisation ont trait à un système qui fonctionne dans des niveaux multiples, au moins une partie de la sortie d'un niveau constituant l'entrée du niveau suivant. Chaque niveau analyse globalement des collections de documents sur le réseau, à l'aide de critères de plus en plus restrictifs concernant la matière traitée dans chaque collection et/ou définissant quelles sont les collections qui peuvent être associées à un ou plusieurs sujets ou sous-sujets. En général, seul le niveau final effectue un balayage exhaustif de tous les documents des collections qui sont identifiées par le système comme étant pertinentes pour le sujet ou le sous-sujet d'intérêt.</description><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>PHYSICS</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2008</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZFDzDfUJ8dQN8XQNcnVRcHYMdnZ08fRzV3AOcgz3ATGCI4NDXH15GFjTEnOKU3mhNDeDsptriLOHbmpBfnxqcUFicmpeakl8uL-RgYGFgYmZgaWFo5ExcaoAWScklw</recordid><startdate>20080417</startdate><enddate>20080417</enddate><creator>MOORE, MATTHEW</creator><creator>WHITLEY, SEAN</creator><creator>ZHANG, ZHE</creator><creator>PIASECZNY, WOJTEK</creator><creator>DUFFY, PAUL</creator><creator>DETUNO, JOE</creator><scope>EVB</scope></search><sort><creationdate>20080417</creationdate><title>MULTI-TIERED CASCADING CRAWLING SYSTEM</title><author>MOORE, MATTHEW ; WHITLEY, SEAN ; ZHANG, ZHE ; PIASECZNY, WOJTEK ; DUFFY, PAUL ; DETUNO, JOE</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2008046098A23</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2008</creationdate><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>PHYSICS</topic><toplevel>online_resources</toplevel><creatorcontrib>MOORE, MATTHEW</creatorcontrib><creatorcontrib>WHITLEY, SEAN</creatorcontrib><creatorcontrib>ZHANG, ZHE</creatorcontrib><creatorcontrib>PIASECZNY, WOJTEK</creatorcontrib><creatorcontrib>DUFFY, PAUL</creatorcontrib><creatorcontrib>DETUNO, JOE</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>MOORE, MATTHEW</au><au>WHITLEY, SEAN</au><au>ZHANG, ZHE</au><au>PIASECZNY, WOJTEK</au><au>DUFFY, PAUL</au><au>DETUNO, JOE</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>MULTI-TIERED CASCADING CRAWLING SYSTEM</title><date>2008-04-17</date><risdate>2008</risdate><abstract>Provided is a multi-tiered cascading crawling system for finding on a network information related to one or more predetermined topics or subtopics of interest. In general, embodiments of the present invention provide a system that operates in multiple "tiers," where at least some of the output of one tier is used to comprise the input of the next tier. Each tier generally analyzes collections of documents on the network using successively more restrictive criteria about the subject matter of each collection and/or about which collections may be related to the one or more topics or subtopics. In general, only the final tier performs an exhaustive crawl of all of the documents of the collections that are identified by the system as being relevant to the topic or subtopic of interest. L'invention concerne un système de balayage en cascade multiniveau, qui est destiné à trouver, sur un réseau, des informations relatives à un ou plusieurs sujets ou sous-sujets d'intérêt prédéterminés. En général, des modes de réalisation ont trait à un système qui fonctionne dans des niveaux multiples, au moins une partie de la sortie d'un niveau constituant l'entrée du niveau suivant. Chaque niveau analyse globalement des collections de documents sur le réseau, à l'aide de critères de plus en plus restrictifs concernant la matière traitée dans chaque collection et/ou définissant quelles sont les collections qui peuvent être associées à un ou plusieurs sujets ou sous-sujets. En général, seul le niveau final effectue un balayage exhaustif de tous les documents des collections qui sont identifiées par le système comme étant pertinentes pour le sujet ou le sous-sujet d'intérêt.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2008046098A2
source esp@cenet
subjects CALCULATING
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
PHYSICS
title MULTI-TIERED CASCADING CRAWLING SYSTEM
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2024-12-29T00%3A22%3A45IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=MOORE,%20MATTHEW&rft.date=2008-04-17&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2008046098A2%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true