数据缺失时基于BP神经网络的作者重名辨识研究

作者重名辨识工作是情报学、知识管理、文献计量学与科学计量学等工作的基础,在利用聚类、分类等机器学习方法进行作者重名辨识时,论文元数据中各字段缺失情况非常严重,会导致算法失效.针对这一现象,本研究主要聚焦于较准确地确定每一字段在作者重名辨识上的能力,通过构建字段贡献度评价体系,在数据缺失情况下,计算现有的每项信息在作者重名辨识中的作用,即"贡献度".设计了组合的唯一性指标,并建立了一个基于BP神经网络的作者重名辨识算法,利用"王伟"的论文进行实验,验证了所提算法的有效性和可靠性....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:情报学报 2018, Vol.37 (6), p.600-609
Hauptverfasser: 柯昊, 李天, 周悦, 钟玉颖, 俞征鹿, 袁军鹏
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:作者重名辨识工作是情报学、知识管理、文献计量学与科学计量学等工作的基础,在利用聚类、分类等机器学习方法进行作者重名辨识时,论文元数据中各字段缺失情况非常严重,会导致算法失效.针对这一现象,本研究主要聚焦于较准确地确定每一字段在作者重名辨识上的能力,通过构建字段贡献度评价体系,在数据缺失情况下,计算现有的每项信息在作者重名辨识中的作用,即"贡献度".设计了组合的唯一性指标,并建立了一个基于BP神经网络的作者重名辨识算法,利用"王伟"的论文进行实验,验证了所提算法的有效性和可靠性.
ISSN:1000-0135
DOI:10.3772/j.issn.1000-0135.2018.06.005