LARGE SCALE SOCIAL GRAPH SEGMENTATION

A method of complementary clustering of a vast population of objects is disclosed. The method aims at maximizing a global measure of object affinity within naturally-formed clusters. A first clustering procedure produces primary centroids of clusters of objects and a second clustering procedure prod...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: HANKINSON, Stephen James Frederic, BURKE, Timothy Andrew
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A method of complementary clustering of a vast population of objects is disclosed. The method aims at maximizing a global measure of object affinity within naturally-formed clusters. A first clustering procedure produces primary centroids of clusters of objects and a second clustering procedure produces secondary clusters of the primary centroids and corresponding secondary centroids. Refined clusters of the population of objects are formed based on object proximity to the secondary centroids. The first clustering procedure is preferably based on a variation of the K-means method, and the second clustering procedure is preferably based on the Density-Based Spatial Clustering of Applications with Noise (DBSCAN). An apparatus implementing the method is devised to facilitate conflict-free parallel processing. L'invention concerne un procédé de regroupement complémentaire d'une vaste population d'objets. Le procédé permet d'optimiser une mesure globale d'affinité d'un objet dans des groupes formés naturellement. Une première procédure de regroupement produit des centroïdes primaires de groupes d'objets et une seconde procédure de regroupement produit des groupes secondaires des centroïdes primaires et des centroïdes secondaires correspondants. Des groupes affinés de la population d'objets sont formés en fonction de la proximité d'objets par rapport aux centroïdes secondaires. La première procédure de regroupement est fondée de préférence sur une variation du procédé de k-moyennes et la seconde procédure de regroupement est fondée de préférence sur le regroupement spatial par densité d'applications en présence de bruit (DBSCAN). Un appareil permettant la mise en œuvre du procédé est conçu pour faciliter un traitement parallèle sans conflit.