CONTENT CREATION FROM EXTRACTED CONTENT

Examples describe content creation of at least one abstract from extracted content. Input information is received that comprises a link to a landing page and keyword information (302). The landing page is evaluated and content including at least one of image data and text data is extracted from the...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: JOURDAIN, MATHIAS, LIN, YING, YANG, GUANG
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Examples describe content creation of at least one abstract from extracted content. Input information is received that comprises a link to a landing page and keyword information (302). The landing page is evaluated and content including at least one of image data and text data is extracted from the landing page (304). Properties of the content extracted are analyzed (306). The content extracted is ranked based on the analyzed properties and application of at least two ranking algorithms (308). A first ranking algorithm applied ranks the content based on relevance to the landing page and a second ranking algorithm applied ranks the content extracted based on relevance to the keyword information. The ranked content is filtered to remove content or portions of content that are determined to be unappealing based on applying filtering rules to the ranked content(310). At least one abstract is created from the filtered and ranked content (312). La présente invention concerne, selon des exemples, la création de contenu d'au moins un abrégé à partir d'un contenu extrait. Des informations d'entrée sont reçues, lesdites informations comprenant un lien vers une page de destination et des informations de mot clé (302). La page de destination est évaluée et le contenu comportant des données image et/ou des données texte est extrait de la page de destination (304). Des propriétés du contenu extrait sont analysées (306). Le contenu extrait est classé sur la base des propriétés analysées et de l'application d'au moins deux algorithmes de classement (308). Un premier algorithme de classement appliqué classe le contenu sur la base de la pertinence par rapport à la page de destination et un second algorithme de classement appliqué classe le contenu extrait sur la base de la pertinence par rapport aux informations de mot clé. Le contenu classé est filtré afin de supprimer un contenu ou des parties de contenu qui sont déterminés comme étant peu attrayants sur la base de l'application de règles de filtrage sur le contenu classé (310). Au moins un abrégé est créé à partir du contenu filtré et classé (312).