METHOD FOR AUTOMATIC CLASSIFICATION OF ELECTRONIC DOCUMENTS IN AN ELECTRONIC DOCUMENT MANAGEMENT SYSTEM WITH AUTOMATIC GENERATION OF RESOLUTION PROPS OF A MANAGER
FIELD: data processing.SUBSTANCE: invention relates to classification systems of documents. Method consists in selection and analysis of formal part of received document, conversion of informative part of document into text in natural language, converting words of a converted document into basic wor...
Gespeichert in:
Hauptverfasser: | , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; rus |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | FIELD: data processing.SUBSTANCE: invention relates to classification systems of documents. Method consists in selection and analysis of formal part of received document, conversion of informative part of document into text in natural language, converting words of a converted document into basic word forms, discarding non-significant words, calculating word weights in a document in accordance with frequencies of occurrence thereof and forming document features. At the training stage, systems of predicates for identifying text attributes of the received document are formed and stored in a database. When classifying a document based on the obtained classification features using a database, a decision is made on the relevance of the document to the authority of the official, determining the corresponding confidentiality mark and instructions thereon, thereby forming a "resolution" props.EFFECT: automation of classification of formalized documents in electronic document management system according to areas of competence of officials, formation "resolution" of each document based on the classification of the requisite.1 cl, 1 dwg
Изобретение относится к системам классификации документов. Техническим результатом является автоматизация классификации формализованных документов в системе электронного документооборота по областям компетенции должностных лиц, формирования на основе классификации реквизита «резолюция» каждого документа. Способ заключается в выделении и анализе формальной части поступившего документа, осуществлении преобразования информативной части документа в текст на естественном языке, преобразования слов преобразованного документа в базовые словоформы, отбрасывании незначимых слов, осуществлении подсчета весов слов в документе в соответствии с частотами их появления и формировании признаков документа. На этапе обучения формируют системы предикатов идентификации признаков текста поступившего документа и сохраняют их в базе данных. При классификации документа на основании полученных классификационных признаков с помощью базы данных принимают решение об относимости документа к компетенции должностного лица, определяют соответствующую ему метку конфиденциальности и поручения по нему, формируя реквизит «резолюция». 1 ил. |
---|