面向制造过程数据的两阶段无监督特征选择方法

TG156; 现代化制造车间无时无刻不在产生大量数据,其中绝大部分以无标签结构化原始数据的形式存储在现代化制造企业的工业大数据平台中.这些制造数据一方面具有很大的潜在价值,另一方面因为其具有高噪声、高冗余性的特点,难以直接分析与利用.因此,针对制造过程原始数据的特点,以去除制造数据冗余性、挖掘原始数据局部结构为目的,提出一种两阶段无监督特征选择方法.该方法的第一阶段采用遗传算法产生的原始数据的低维子集作为径向基神经网络(Radial basis fuction neural network,RBFNN)的输入,利用RBFNN复现原始数据的全部维度,并以降维率及复现精度作为遗传算法(Geneti...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:机械工程学报 2019-09, Vol.55 (17), p.133-144
Hauptverfasser: 张洁, 盛夏, 张朋, 秦威, 赵新明
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:TG156; 现代化制造车间无时无刻不在产生大量数据,其中绝大部分以无标签结构化原始数据的形式存储在现代化制造企业的工业大数据平台中.这些制造数据一方面具有很大的潜在价值,另一方面因为其具有高噪声、高冗余性的特点,难以直接分析与利用.因此,针对制造过程原始数据的特点,以去除制造数据冗余性、挖掘原始数据局部结构为目的,提出一种两阶段无监督特征选择方法.该方法的第一阶段采用遗传算法产生的原始数据的低维子集作为径向基神经网络(Radial basis fuction neural network,RBFNN)的输入,利用RBFNN复现原始数据的全部维度,并以降维率及复现精度作为遗传算法(Genetic algorithm,GA)的适应度函数,通过GA多次迭代学习高维特征的低维表示,删除原始数据集中的冗余特征与噪声特征.第二阶段采用拉普拉斯特征得分(Laplacian score,LS)逐维评价剩余特征对于反映数据局部几何结构的作用,挖掘对改善分类性能更有效的特征.通过与LS等无监督特征选择算法对比,验证了提出的两阶段无监督特征选择方法能够有效降低制造数据的冗余性,并提高数据的分类性能.
ISSN:0577-6686
DOI:10.3901/JME.2019.17.133