数据缺失时基于BP神经网络的作者重名辨识研究
作者重名辨识工作是情报学、知识管理、文献计量学与科学计量学等工作的基础,在利用聚类、分类等机器学习方法进行作者重名辨识时,论文元数据中各字段缺失情况非常严重,会导致算法失效.针对这一现象,本研究主要聚焦于较准确地确定每一字段在作者重名辨识上的能力,通过构建字段贡献度评价体系,在数据缺失情况下,计算现有的每项信息在作者重名辨识中的作用,即"贡献度".设计了组合的唯一性指标,并建立了一个基于BP神经网络的作者重名辨识算法,利用"王伟"的论文进行实验,验证了所提算法的有效性和可靠性....
Gespeichert in:
Veröffentlicht in: | 情报学报 2018, Vol.37 (6), p.600-609 |
---|---|
Hauptverfasser: | , , , , , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | 作者重名辨识工作是情报学、知识管理、文献计量学与科学计量学等工作的基础,在利用聚类、分类等机器学习方法进行作者重名辨识时,论文元数据中各字段缺失情况非常严重,会导致算法失效.针对这一现象,本研究主要聚焦于较准确地确定每一字段在作者重名辨识上的能力,通过构建字段贡献度评价体系,在数据缺失情况下,计算现有的每项信息在作者重名辨识中的作用,即"贡献度".设计了组合的唯一性指标,并建立了一个基于BP神经网络的作者重名辨识算法,利用"王伟"的论文进行实验,验证了所提算法的有效性和可靠性. |
---|---|
ISSN: | 1000-0135 |
DOI: | 10.3772/j.issn.1000-0135.2018.06.005 |