基于语音卷积稀疏迁移学习和并行优选的帕金森病分类算法研究
TP391.42%R749; 基于语音数据分析的帕金森病(PD)诊断存在样本量小、训练与测试数据分布差异明显的问题.为了解决这些问题,需要从降维和样本扩充两个方面同时进行.因此,该文提出结合加噪加权卷积稀疏迁移学习和样本特征并行优选的PD分类算法.该算法可从源域的公共语音库中学习有利于表达PD语音特征的有效结构信息,同时完成降维和样本间接扩充.样本特征并行优选考虑到了样本和语音特征间的关系,从而有助于获取高质量的特征.首先,对公共语音库进行特征提取构造公共特征库;然后,以公共特征库对PD目标域的训练数据集及测试数据集进行稀疏编码,这里分别采用传统稀疏编码(SC)与卷积稀疏编码(CSC)两种稀疏...
Gespeichert in:
Veröffentlicht in: | 电子与信息学报 2019, Vol.41 (7), p.1641-1649 |
---|---|
Hauptverfasser: | , , , , , , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | TP391.42%R749; 基于语音数据分析的帕金森病(PD)诊断存在样本量小、训练与测试数据分布差异明显的问题.为了解决这些问题,需要从降维和样本扩充两个方面同时进行.因此,该文提出结合加噪加权卷积稀疏迁移学习和样本特征并行优选的PD分类算法.该算法可从源域的公共语音库中学习有利于表达PD语音特征的有效结构信息,同时完成降维和样本间接扩充.样本特征并行优选考虑到了样本和语音特征间的关系,从而有助于获取高质量的特征.首先,对公共语音库进行特征提取构造公共特征库;然后,以公共特征库对PD目标域的训练数据集及测试数据集进行稀疏编码,这里分别采用传统稀疏编码(SC)与卷积稀疏编码(CSC)两种稀疏编码方法;接着,对编码后的语音样本段和特征数据进行同时优选;最后,采用支撑向量机(SVM)进行分类.实验结果表明,该算法针对受试者的分类准确率最高值达到了95.0%,均值达到了86.0%,较相关被比较算法有较大提高.此外,研究还发现,相较于传统稀疏编码方法,卷积稀疏编码更有利于提取PD语音数据的高层特征;同样,迁移学习也有利于提高该算法性能. |
---|---|
ISSN: | 1009-5896 |
DOI: | 10.11999/JEIT180792 |