MOLMAP指数及其在变异性预测中的应用

分子映射(MOLMAP)指数是以分子的化学键描述符为基础,通过Kohonen自组织映射依据一定的算法而衍生.化学键描述符是由化学键的物理化学性质,如两端原子的电荷差和拓扑性质,键连杂原子数量等所组成.本文将分子映射指数应用于4075个有机物质(Ames实验结果:2305个结构有诱变性,1770个结构无诱变性)的变异性预测.通过随机森林,分别采用三种类型的指数建立模型:(1)采用不同维数的分子映射指数;(2)采用全局分子描述符;(3)将分子映射指数与全局分子描述符相结合.整个数据集的集外(out-of-bag)交叉验证的正确预测率达到85.4%.为了检验模型的稳定性,采用所建模型预测源于另一数据...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:物理化学学报 2012, Vol.28 (3), p.541-546
1. Verfasser: 张庆友 龙海林 冯秀林 索净洁 张丹丹 李静亚 许力壮 许禄
Format: Artikel
Sprache:chi
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:分子映射(MOLMAP)指数是以分子的化学键描述符为基础,通过Kohonen自组织映射依据一定的算法而衍生.化学键描述符是由化学键的物理化学性质,如两端原子的电荷差和拓扑性质,键连杂原子数量等所组成.本文将分子映射指数应用于4075个有机物质(Ames实验结果:2305个结构有诱变性,1770个结构无诱变性)的变异性预测.通过随机森林,分别采用三种类型的指数建立模型:(1)采用不同维数的分子映射指数;(2)采用全局分子描述符;(3)将分子映射指数与全局分子描述符相结合.整个数据集的集外(out-of-bag)交叉验证的正确预测率达到85.4%.为了检验模型的稳定性,采用所建模型预测源于另一数据库的472个化合物,正确预测率为86.7%,与此前的研究相比,两个预测结果均有所提高.
ISSN:1000-6818
DOI:10.3866/PKU.WHXB201112281