CLUSTERING DEVICE, METHOD AND PROGRAM

PROBLEM TO BE SOLVED: To cluster a plurality of data points at a high speed even when the number of data points and the number of clusters are large.SOLUTION: An affiliation cluster center search part 26 determines an affiliation cluster at each of a plurality of data points. A cluster center update...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MATSUBAYASHI TATSUFUMI, SAWADA HIROSHI, TOU KOUSHIN, ICHIKAWA YUSUKE
Format: Patent
Sprache:eng ; jpn
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:PROBLEM TO BE SOLVED: To cluster a plurality of data points at a high speed even when the number of data points and the number of clusters are large.SOLUTION: An affiliation cluster center search part 26 determines an affiliation cluster at each of a plurality of data points. A cluster center update part 28 updates the center position of each of the plurality of clusters based upon the position of the data point determined to be affiliated to the cluster, calculates a movement distance between center positions of the cluster before and after the update, and determines a frequency at which a process of determining a cluster affiliated to each of a plurality of data points based upon a movement distance of the center position of the cluster that the calculated data point is affiliated to. A convergence determination part 30 repeats a determination by the affiliation cluster center search part 26 and a determination by the cluster center update part 28 until a predetermined convergence condition is met.SELECTED DRAWING: Figure 3 【課題】データ点の数及びクラスタの数が大きな値であっても、複数のデータ点を高速にクラスタリングする。【解決手段】所属クラスタ中心探索部26により、複数のデータ点の各々について、データ点の所属するクラスタを決定し、クラスタ中心更新部28により、複数のクラスタの各々について、クラスタに所属すると決定されたデータ点の位置に基づいて、クラスタの中心位置を更新し、更新前と更新後のクラスタの中心位置の移動距離を計算し、複数のデータ点の各々について、計算されたデータ点の所属するクラスタの中心位置の移動距離に基づいて、データ点についての所属するクラスタを決定する処理を行う頻度を決定し、収束判定部30により、予め定められた収束条件を満たすまで、所属クラスタ中心探索部26による決定と、クラスタ中心更新部28による決定とを繰り返す。【選択図】図3