SYSTEM AND METHOD OF SIMILAR FILES DETERMINING

FIELD: information technology.SUBSTANCE: method of similar files determining, in which the set of immutable and mutable files characteristics are defined; in this case the file characteristics is considered as a variable sign, if the characteristic takes different values for a plurality of similar f...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: Romanenko Aleksej Mikhajlovich, Antonov Aleksej Evgenevich
Format: Patent
Sprache:eng ; rus
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:FIELD: information technology.SUBSTANCE: method of similar files determining, in which the set of immutable and mutable files characteristics are defined; in this case the file characteristics is considered as a variable sign, if the characteristic takes different values for a plurality of similar files. File characteristics are considered as immutable, if a characteristic takes the same value for a plurality of similar files; a variety of charateristics is separated from at least one file; a plurality of separated file characteristics is divided into at least two subsets: the subset of variable characteristics and a subset of the immutable characteristics; the convolution of each of the abovementioned subsets of file characteristics is formed; the file convolution is formed as a convolution combination of each of the abovementioned subsets of file characteristics; the convolution of at least one file is compared with a set of pre-designed file convolutions; the file is recognized as similar to the files from the plurality of similar files having the same convolution, if by comparison the convolution of the noted file is the same as the file convolution from the noted plurality.EFFECT: finding of similar files.2 cl, 5 dwg Изобретение относится к вычислительной технике. Технический результат заключается в определении похожих файлов. Способ определения похожести файлов, в котором определяют множества изменяемых и неизменяемых признаков файлов; при этом признак файла считают изменяемым, если для множества похожих файлов признак принимает различные значения; при этом признак файла считают неизменяемым, если для множества похожих файлов признак принимает одинаковое значение; выделяют множество признаков по меньшей мере из одного файла; разделяют множество выделенных признаков файла по меньшей мере на два подмножества: подмножество изменяемых признаков и подмножество неизменяемых признаков; формируют свертку каждого из вышеописанных подмножеств признаков файла; формируют свертку файла как комбинацию сверток каждого из вышеописанных подмножеств признаков файла; сравнивают свертку по меньшей мере одного файла с набором заранее созданных сверток файлов; признают файл похожим на файлы из множества похожих файлов, имеющих одинаковую свертку, если при сравнении свертка указанного файла совпадает со сверткой файла из указанного множества. 2 н.п. ф-лы, 5 ил.