融合引用语义和语境特征的作者引文耦合分析法

作者引文耦合分析是发现领域活跃研究社群与知识结构的重要工具.当前该方法主要利用引用次数朴素地表征作者间的联系强度,忽视了耦合双方在更深层次上的相似性.为增强现有方法的可靠性与分析深度,本研究试图利用丰富的全文本资源,挖掘引用内容所蕴含的"引了什么""在何处引""引用的重要性如何"等关键信息,从施引动机的相似性这一本质层面优化引文耦合强度,提出一种融合引用语义和语境特征的作者引文耦合分析法.该方法通过深入学术论文全文,抽取耦合双方在施引论文中引用内容的语义和语境特征,以此计算增强型引文耦合强度,为每一次引文耦合赋予不同的相似程度值;在此...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:情报学报 2022, Vol.41 (8), p.796-811
Hauptverfasser: 张汝昊, 袁军鹏
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:作者引文耦合分析是发现领域活跃研究社群与知识结构的重要工具.当前该方法主要利用引用次数朴素地表征作者间的联系强度,忽视了耦合双方在更深层次上的相似性.为增强现有方法的可靠性与分析深度,本研究试图利用丰富的全文本资源,挖掘引用内容所蕴含的"引了什么""在何处引""引用的重要性如何"等关键信息,从施引动机的相似性这一本质层面优化引文耦合强度,提出一种融合引用语义和语境特征的作者引文耦合分析法.该方法通过深入学术论文全文,抽取耦合双方在施引论文中引用内容的语义和语境特征,以此计算增强型引文耦合强度,为每一次引文耦合赋予不同的相似程度值;在此基础上,通过"论文-主题-作者"聚合映射考虑作者的多元兴趣倾向,最终获得作者间的研究主题相似性度量.为证明提出方法的有效性,本研究利用中文"图书情报与数字图书馆"领域的13562篇论文的全文本数据开展了实证研究.实证结果表明,提出方法相较于现有作者引文耦合分析法具有更优的作者兴趣社群发现效果,呈现出更佳、更细致的聚类群落分布,划分出的作者兴趣社群具有更高的群内研究主题同质性和互引概率;此外,提出方法面向大体量作者时的表现更为稳定,具有拓展和应用前景.
ISSN:1000-0135
DOI:10.3772/j.issn.1000-0135.2022.08.003