基于层次注意力网络的论证区间识别研究

G35; 学术文本论证区间识别是一项论证学术文献内容和分析修辞结构的研究,针对当前研究过多依赖人工经验来构建规则和特征的现状,以及论证区间识别研究存在时效性差、泛化能力弱等问题,本文采用基于层次注意力机制的HAN深度学习模型对学术文本论证区间识别进行了研究.本文首先构建了一个基于层次注意力机制的论证区间识别模型,阐述了该模型的整体架构和作用机制.其次,针对生物医学领域提出了一个论证区间9分类体系,在PubMed生物医学数据集上,用LSTM和SVM两种文本分类算法与HAN模型进行对比实验.研究结果表明,本文所采用的HAN模型在各个类别的论证区间识别上效果均为最优,F1值达到了0.90,能够较好的...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:情报工程 2020, Vol.6 (3), p.52-62
Hauptverfasser: 王鑫, 程齐凯, 马永强, 罗卓然
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:G35; 学术文本论证区间识别是一项论证学术文献内容和分析修辞结构的研究,针对当前研究过多依赖人工经验来构建规则和特征的现状,以及论证区间识别研究存在时效性差、泛化能力弱等问题,本文采用基于层次注意力机制的HAN深度学习模型对学术文本论证区间识别进行了研究.本文首先构建了一个基于层次注意力机制的论证区间识别模型,阐述了该模型的整体架构和作用机制.其次,针对生物医学领域提出了一个论证区间9分类体系,在PubMed生物医学数据集上,用LSTM和SVM两种文本分类算法与HAN模型进行对比实验.研究结果表明,本文所采用的HAN模型在各个类别的论证区间识别上效果均为最优,F1值达到了0.90,能够较好的完成论证区间识别研究.最后,对实验结果进行错误总结和分析,并指出了下一步的研究方向.
ISSN:2095-915X
DOI:10.3772/j.issn.2095-915x.2020.03.005