基于语音卷积稀疏迁移学习和并行优选的帕金森病分类算法研究

TP391.42%R749; 基于语音数据分析的帕金森病(PD)诊断存在样本量小、训练与测试数据分布差异明显的问题.为了解决这些问题,需要从降维和样本扩充两个方面同时进行.因此,该文提出结合加噪加权卷积稀疏迁移学习和样本特征并行优选的PD分类算法.该算法可从源域的公共语音库中学习有利于表达PD语音特征的有效结构信息,同时完成降维和样本间接扩充.样本特征并行优选考虑到了样本和语音特征间的关系,从而有助于获取高质量的特征.首先,对公共语音库进行特征提取构造公共特征库;然后,以公共特征库对PD目标域的训练数据集及测试数据集进行稀疏编码,这里分别采用传统稀疏编码(SC)与卷积稀疏编码(CSC)两种稀疏...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:电子与信息学报 2019, Vol.41 (7), p.1641-1649
Hauptverfasser: 张小恒, 李勇明, 王品, 曾孝平, 颜芳, 张艳玲, 承欧梅
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:TP391.42%R749; 基于语音数据分析的帕金森病(PD)诊断存在样本量小、训练与测试数据分布差异明显的问题.为了解决这些问题,需要从降维和样本扩充两个方面同时进行.因此,该文提出结合加噪加权卷积稀疏迁移学习和样本特征并行优选的PD分类算法.该算法可从源域的公共语音库中学习有利于表达PD语音特征的有效结构信息,同时完成降维和样本间接扩充.样本特征并行优选考虑到了样本和语音特征间的关系,从而有助于获取高质量的特征.首先,对公共语音库进行特征提取构造公共特征库;然后,以公共特征库对PD目标域的训练数据集及测试数据集进行稀疏编码,这里分别采用传统稀疏编码(SC)与卷积稀疏编码(CSC)两种稀疏编码方法;接着,对编码后的语音样本段和特征数据进行同时优选;最后,采用支撑向量机(SVM)进行分类.实验结果表明,该算法针对受试者的分类准确率最高值达到了95.0%,均值达到了86.0%,较相关被比较算法有较大提高.此外,研究还发现,相较于传统稀疏编码方法,卷积稀疏编码更有利于提取PD语音数据的高层特征;同样,迁移学习也有利于提高该算法性能.
ISSN:1009-5896
DOI:10.11999/JEIT180792