CLUSTERING DEVICE, METHOD, AND PROGRAM
PROBLEM TO BE SOLVED: To cluster a plurality of data points at high speed even when the number of data points and the number of clusters are large, and further to express a degree of belongingness to each cluster with consecutive values 0-1 without limiting clusters to which each data point belong t...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; jpn |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | PROBLEM TO BE SOLVED: To cluster a plurality of data points at high speed even when the number of data points and the number of clusters are large, and further to express a degree of belongingness to each cluster with consecutive values 0-1 without limiting clusters to which each data point belong to a single one.SOLUTION: In a clustering device, a cluster belongingness degree update unit 26 determines, for each of a plurality of data points, a degree of belongingness of data points to each cluster. A cluster center update unit 28 updates, for each of a plurality of clusters, positions of all data points, the degree of belongingness of all data points to the cluster, and a center position of the cluster, calculates a moved distance of the center position of the cluster before and after the updating, and repeats, for each of the plurality of data points, the determination of a frequency with which a process to determine the degree of belongingness of the data points to each cluster is executed, on the basis of the moved distances of center positions of all clusters, the degree of belongingness of the data points to each cluster, and softening parameters.SELECTED DRAWING: Figure 11
【課題】データ点の数及びクラスタの数が大きな値であっても、複数のデータ点を高速にクラスタリングする。また、各データ点の所属するクラスタを単一に限定せずに、0〜1の連続値で各クラスタへの帰属度を表現する。【解決手段】クラスタ帰属度更新部26により、複数のデータ点の各々について、データ点の各クラスタへの帰属度を決定し、クラスタ中心更新部28により、複数のクラスタの各々について、すべてのデータ点の位置と、すべてのデータ点の該当クラスタへの帰属度と、クラスタの中心位置を更新し、更新前と更新後のクラスタの中心位置の移動距離を計算し、複数のデータ点の各々について、すべてのクラスタの中心位置の移動距離と、該当データ点の各クラスタへの帰属度と、ソフト化パラメータとに基づいて、データ点についての各クラスタへの帰属度を決定する処理を行う頻度を決定することを繰り返す。【選択図】図11 |
---|