METHODS AND SYSTEMS FOR CATEGORIZING AND INDEXING HUMAN-READABLE DATA

Systems and methods (20, 200) for processing content packages such as human-readable documents identify and analyze content type. Structural (300) and logical (500) evaluation of a content package is performed, followed by analysis and indexing of concepts within the package. Analysis and identifica...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MAHONEY, JOHN, CURTIS, KEVIN, KOLFMAN, MICHAEL, BOROVIKOV, DMITRY
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Systems and methods (20, 200) for processing content packages such as human-readable documents identify and analyze content type. Structural (300) and logical (500) evaluation of a content package is performed, followed by analysis and indexing of concepts within the package. Analysis and identification of concepts and sub-concepts may be an iterative process. Concepts are indexed (800) in accordance with different rule sets representing different consumer needs and perspectives. Customers can then use the indices to navigate large groups of content packages based on the concepts contained within those packages and also on keywords associated with concepts. L'invention concerne des systèmes et des procédés (20, 200) permettant de traiter des blocs de contenu tels que des documents interprétables par l'utilisateur qui identifient et analysent le type de contenu. Ces procédés consistent à effectuer une évaluation structurelle (300) et logique (500) d'un bloc de contenu puis une analyse et un indexation des concepts à l'intérieur du bloc. L'analyse et l'identification de concepts et de sous-concepts peut être un processus itératif. Des concepts sont indexés (800) selon différents ensembles de règles représentant différents besoins et perspectives d'utilisateur. Des clients peuvent alors utiliser les indices pour naviguer dans de grands groupes de blocs de contenu basés sur les concepts contenus dans ces blocs et sur les mots clés associés aux concepts.