ELASTIC DISTRIBUTION QUEUING OF MASS DATA FOR THE USE IN DIRECTOR DRIVEN COMPANY ASSESSMENT
An elastic distribution queuing system for mass data comprising: a data source; a matching engine for matching and/or appending a corporate identifier to data from the data source, thereby creating enhanced data; a distributed queuing system which determines how much the enhanced data is being inges...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | An elastic distribution queuing system for mass data comprising: a data source; a matching engine for matching and/or appending a corporate identifier to data from the data source, thereby creating enhanced data; a distributed queuing system which determines how much the enhanced data is being ingested by the distributed queuing system and how many distributed processing nodes will be required to process the enhanced data; a structured streaming engine for distributed processing of the enhanced data from each the distributed processing node; a decision tree engine which identifies at least one data element from the enhanced data and determines a value of importance of the data element; a logistic regression model which determines the probability of failure of a corporate entity associated with the enhanced data based upon the value of importance of the data element; and an output of the results from the logistic regression model regarding the probability of failure for the corporate entity.
L'invention concerne un système de mise en file d'attente de distribution élastique de données de masse comprenant : une source de données ; un moteur de mise en correspondance servant à mettre en correspondance et/ou à ajouter un identifiant d'entreprise à des données provenant de la source de données, créant ainsi des données enrichies ; un système de mise en file d'attente distribué qui détermine la manière dont les données enrichies sont ingérées par le système de mise en file d'attente distribué et le nombre de nœuds de traitement distribués qui seront nécessaires pour traiter les données enrichies ; un moteur de diffusion en continu structuré permettant un traitement distribué des données enrichies à partir de chaque nœud de traitement distribué ; un moteur d'arbre de décision qui identifie au moins un élément de données à partir des données enrichies et qui détermine une valeur d'importance de l'élément de données ; un modèle de régression logistique qui détermine la probabilité de défaillance d'une entité d'entreprise associée aux données enrichies sur la base de la valeur d'importance de l'élément de données ; et une sortie des résultats à partir du modèle de régression logistique concernant la probabilité de défaillance de l'entité d'entreprise. |
---|