基于降噪变分自编码器的SNP位点与药物关联预测算法

单核苷酸多态性(Single nucletide ploymorphysim,SNP)是研究人类家族和动植物品系遗传变异的重要依据,被广泛用于群体遗传学研究和疾病相关基因的研究,在药物基因组学、诊断学和生物医学中起重要作用.在药物基因组学研究中,识别SNP位点与药物之间的关联关系是临床精准用药的关键.为此,提出了一种基于降噪变分自编码器和支持向量机(Denoising variational auto-encoder and support vector machine,DVAE-SVM)的SNP位点与药物关联预测模型.首先,引入k-mer算法和MACCS(Molecular access s...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:测试科学与仪器 2022, Vol.13 (3), p.300-308
Hauptverfasser: 宋晓宇, 冯小蓓, 朱林, 刘童, 吴鸿阳, 李一凡
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:单核苷酸多态性(Single nucletide ploymorphysim,SNP)是研究人类家族和动植物品系遗传变异的重要依据,被广泛用于群体遗传学研究和疾病相关基因的研究,在药物基因组学、诊断学和生物医学中起重要作用.在药物基因组学研究中,识别SNP位点与药物之间的关联关系是临床精准用药的关键.为此,提出了一种基于降噪变分自编码器和支持向量机(Denoising variational auto-encoder and support vector machine,DVAE-SVM)的SNP位点与药物关联预测模型.首先,引入k-mer算法和MACCS(Molecular access system)分子指纹对SNP位点和药物进行数字化表征,生成初始的特征向量.随后,对SNP位点的初始特征向量采用降噪变分自编码器提取有效特征.最后,将SNP位点的有效特征向量与药物初始特征向量融合输入到支持向量机中进行关联关系预测.五倍交叉验证实验结果显示,该算法预测效果好于随机森林(Random forest,RF)、逻辑回归(Logistic regression,LR)分类器、主成分分析(Principal component analysis,PCA)、去噪自编码器(Denoising auto-encoder,DAE)和变分自编码器(Variational auto-encoder,VAE)特征提取算法的预测结果.
ISSN:1674-8042
DOI:10.3969/j.issn.1674-8042.2022.03.006