COMPUTER BASED SUMMARIZATION OF NATURAL LANGUAGE DOCUMENTS

A system and method for summarizing the contents of a natural language document provided in electronic or digital form includes pre-formatting the document (10), performing linguistic analysis (120), weighting each sentence (130) in the document as a function of quantitative importance, and generati...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: TSOURIKOV, VALERY, BATCHILO, LEONID, SOVPEL, IGOR
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A system and method for summarizing the contents of a natural language document provided in electronic or digital form includes pre-formatting the document (10), performing linguistic analysis (120), weighting each sentence (130) in the document as a function of quantitative importance, and generating one or more document summaries (140), from a plurality of selectable document summary types, as a function of the sentence weights. L'invention concerne un système et un procédé de récapitulation des contenus d'un document en langage naturel fourni sous forme électronique ou numérique, le procédé consistant en premier à formater le document (10), puis à réaliser une analyse linguistique (120), à pondérer chaque phrase (130) du document en fonction de l'importance quantitative, et à produire une ou plusieurs récapitulations de document (140), à partir de plusieurs types de récapitulation de document sélectionnables, en fonction des pondérations de phrase.