METHOD FOR STABLE SET SIMILARITY JOINS

Provided is a method for the set similarity join, wherein each set represents a process and each token represents a process step. The process comprises a series of process steps executed in at least one source computer system. Hence, similar sets represent similar processes within a collection of pr...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MANN, Willi, SCHMITT, Daniel, MILLER, Alexander, KOCHER, Daniel, AUGSTEN, Nikolaus
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator MANN, Willi
SCHMITT, Daniel
MILLER, Alexander
KOCHER, Daniel
AUGSTEN, Nikolaus
description Provided is a method for the set similarity join, wherein each set represents a process and each token represents a process step. The process comprises a series of process steps executed in at least one source computer system. Hence, similar sets represent similar processes within a collection of processes. The method is based on a two-level signature scheme. Having indexed the sets using a first signature into inverted lists, selected lists, in particular long lists, are reindexed using a second signature. As a result, the number of candidates and thus the number of required distance calculations can be effectively reduced. Its experimental evaluation has shown that the method consistently outperforms state-of-the-art algorithms on datasets with diverging characteristics, suggesting a stable solution for a wide range of applications. L'invention concerne un procédé permettant la liaison de similarités définie, chaque ensemble représentant un processus et chaque jeton représentant une étape de traitement. Le procédé comprend une série d'étapes de traitement exécutées dans au moins un système informatique source. Par conséquent, des ensembles similaires représentent des processus similaires dans une collection de processus. Le procédé est basé sur un schéma de signature à deux niveaux. Ayant indexé les ensembles à l'aide d'une première signature dans des listes inversées, des listes sélectionnées, en particulier des listes longues, sont indexées de nouveau à l'aide d'une seconde signature. Par conséquent, le nombre de candidats et ainsi le nombre de calculs de distance requis peuvent être efficacement réduits. Son évaluation expérimentale a montré que le procédé surpasse de manière constante des algorithmes d'état de la technique sur des ensembles de données ayant des caractéristiques divergentes, suggérant une solution stable pour une large gamme d'applications.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2023208903A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2023208903A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2023208903A13</originalsourceid><addsrcrecordid>eNrjZFDzdQ3x8HdRcPMPUggOcXTycVUIdg1RCPb09fRxDPIMiVTw8vf0C-ZhYE1LzClO5YXS3AzKbq4hzh66qQX58anFBYnJqXmpJfHh_kYGRsZGBhaWBsaOhsbEqQIATLAkcA</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>METHOD FOR STABLE SET SIMILARITY JOINS</title><source>esp@cenet</source><creator>MANN, Willi ; SCHMITT, Daniel ; MILLER, Alexander ; KOCHER, Daniel ; AUGSTEN, Nikolaus</creator><creatorcontrib>MANN, Willi ; SCHMITT, Daniel ; MILLER, Alexander ; KOCHER, Daniel ; AUGSTEN, Nikolaus</creatorcontrib><description>Provided is a method for the set similarity join, wherein each set represents a process and each token represents a process step. The process comprises a series of process steps executed in at least one source computer system. Hence, similar sets represent similar processes within a collection of processes. The method is based on a two-level signature scheme. Having indexed the sets using a first signature into inverted lists, selected lists, in particular long lists, are reindexed using a second signature. As a result, the number of candidates and thus the number of required distance calculations can be effectively reduced. Its experimental evaluation has shown that the method consistently outperforms state-of-the-art algorithms on datasets with diverging characteristics, suggesting a stable solution for a wide range of applications. L'invention concerne un procédé permettant la liaison de similarités définie, chaque ensemble représentant un processus et chaque jeton représentant une étape de traitement. Le procédé comprend une série d'étapes de traitement exécutées dans au moins un système informatique source. Par conséquent, des ensembles similaires représentent des processus similaires dans une collection de processus. Le procédé est basé sur un schéma de signature à deux niveaux. Ayant indexé les ensembles à l'aide d'une première signature dans des listes inversées, des listes sélectionnées, en particulier des listes longues, sont indexées de nouveau à l'aide d'une seconde signature. Par conséquent, le nombre de candidats et ainsi le nombre de calculs de distance requis peuvent être efficacement réduits. Son évaluation expérimentale a montré que le procédé surpasse de manière constante des algorithmes d'état de la technique sur des ensembles de données ayant des caractéristiques divergentes, suggérant une solution stable pour une large gamme d'applications.</description><language>eng ; fre</language><subject>CALCULATING ; COMPUTING ; COUNTING ; ELECTRIC DIGITAL DATA PROCESSING ; PHYSICS</subject><creationdate>2023</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20231102&amp;DB=EPODOC&amp;CC=WO&amp;NR=2023208903A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,780,885,25564,76547</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20231102&amp;DB=EPODOC&amp;CC=WO&amp;NR=2023208903A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>MANN, Willi</creatorcontrib><creatorcontrib>SCHMITT, Daniel</creatorcontrib><creatorcontrib>MILLER, Alexander</creatorcontrib><creatorcontrib>KOCHER, Daniel</creatorcontrib><creatorcontrib>AUGSTEN, Nikolaus</creatorcontrib><title>METHOD FOR STABLE SET SIMILARITY JOINS</title><description>Provided is a method for the set similarity join, wherein each set represents a process and each token represents a process step. The process comprises a series of process steps executed in at least one source computer system. Hence, similar sets represent similar processes within a collection of processes. The method is based on a two-level signature scheme. Having indexed the sets using a first signature into inverted lists, selected lists, in particular long lists, are reindexed using a second signature. As a result, the number of candidates and thus the number of required distance calculations can be effectively reduced. Its experimental evaluation has shown that the method consistently outperforms state-of-the-art algorithms on datasets with diverging characteristics, suggesting a stable solution for a wide range of applications. L'invention concerne un procédé permettant la liaison de similarités définie, chaque ensemble représentant un processus et chaque jeton représentant une étape de traitement. Le procédé comprend une série d'étapes de traitement exécutées dans au moins un système informatique source. Par conséquent, des ensembles similaires représentent des processus similaires dans une collection de processus. Le procédé est basé sur un schéma de signature à deux niveaux. Ayant indexé les ensembles à l'aide d'une première signature dans des listes inversées, des listes sélectionnées, en particulier des listes longues, sont indexées de nouveau à l'aide d'une seconde signature. Par conséquent, le nombre de candidats et ainsi le nombre de calculs de distance requis peuvent être efficacement réduits. Son évaluation expérimentale a montré que le procédé surpasse de manière constante des algorithmes d'état de la technique sur des ensembles de données ayant des caractéristiques divergentes, suggérant une solution stable pour une large gamme d'applications.</description><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>PHYSICS</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2023</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZFDzdQ3x8HdRcPMPUggOcXTycVUIdg1RCPb09fRxDPIMiVTw8vf0C-ZhYE1LzClO5YXS3AzKbq4hzh66qQX58anFBYnJqXmpJfHh_kYGRsZGBhaWBsaOhsbEqQIATLAkcA</recordid><startdate>20231102</startdate><enddate>20231102</enddate><creator>MANN, Willi</creator><creator>SCHMITT, Daniel</creator><creator>MILLER, Alexander</creator><creator>KOCHER, Daniel</creator><creator>AUGSTEN, Nikolaus</creator><scope>EVB</scope></search><sort><creationdate>20231102</creationdate><title>METHOD FOR STABLE SET SIMILARITY JOINS</title><author>MANN, Willi ; SCHMITT, Daniel ; MILLER, Alexander ; KOCHER, Daniel ; AUGSTEN, Nikolaus</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2023208903A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2023</creationdate><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>PHYSICS</topic><toplevel>online_resources</toplevel><creatorcontrib>MANN, Willi</creatorcontrib><creatorcontrib>SCHMITT, Daniel</creatorcontrib><creatorcontrib>MILLER, Alexander</creatorcontrib><creatorcontrib>KOCHER, Daniel</creatorcontrib><creatorcontrib>AUGSTEN, Nikolaus</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>MANN, Willi</au><au>SCHMITT, Daniel</au><au>MILLER, Alexander</au><au>KOCHER, Daniel</au><au>AUGSTEN, Nikolaus</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>METHOD FOR STABLE SET SIMILARITY JOINS</title><date>2023-11-02</date><risdate>2023</risdate><abstract>Provided is a method for the set similarity join, wherein each set represents a process and each token represents a process step. The process comprises a series of process steps executed in at least one source computer system. Hence, similar sets represent similar processes within a collection of processes. The method is based on a two-level signature scheme. Having indexed the sets using a first signature into inverted lists, selected lists, in particular long lists, are reindexed using a second signature. As a result, the number of candidates and thus the number of required distance calculations can be effectively reduced. Its experimental evaluation has shown that the method consistently outperforms state-of-the-art algorithms on datasets with diverging characteristics, suggesting a stable solution for a wide range of applications. L'invention concerne un procédé permettant la liaison de similarités définie, chaque ensemble représentant un processus et chaque jeton représentant une étape de traitement. Le procédé comprend une série d'étapes de traitement exécutées dans au moins un système informatique source. Par conséquent, des ensembles similaires représentent des processus similaires dans une collection de processus. Le procédé est basé sur un schéma de signature à deux niveaux. Ayant indexé les ensembles à l'aide d'une première signature dans des listes inversées, des listes sélectionnées, en particulier des listes longues, sont indexées de nouveau à l'aide d'une seconde signature. Par conséquent, le nombre de candidats et ainsi le nombre de calculs de distance requis peuvent être efficacement réduits. Son évaluation expérimentale a montré que le procédé surpasse de manière constante des algorithmes d'état de la technique sur des ensembles de données ayant des caractéristiques divergentes, suggérant une solution stable pour une large gamme d'applications.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2023208903A1
source esp@cenet
subjects CALCULATING
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
PHYSICS
title METHOD FOR STABLE SET SIMILARITY JOINS
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-05T10%3A21%3A34IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=MANN,%20Willi&rft.date=2023-11-02&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2023208903A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true