面向金融知识图谱的实体和关系联合抽取算法

TP391.1; 在知识图谱的构建过程中,传统方法先进行命名实体识别,再进行关系抽取,导致任务间关联信息的丢失,而且忽略了实体间的重叠关系.为此,基于能识别重叠关系的Bi-LSTM+CRF模型,通过参数共享实现两个任务联合学习,充分利用任务间联系来优化结果.公开数据集上的实验结果表明:所提出模型在实体识别上取得了78.4%的f1值,在非重叠关系和重叠关系的抽取上取得了50.5%和45.0%的f1值.为验证该方法可后续用于金融知识图谱构建,提取了小型金融数据集来验证其在金融数据上的泛化能力....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:重庆理工大学学报(自然科学版) 2020, Vol.34 (5), p.139-149
Hauptverfasser: 胡扬, 闫宏飞, 陈翀
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:TP391.1; 在知识图谱的构建过程中,传统方法先进行命名实体识别,再进行关系抽取,导致任务间关联信息的丢失,而且忽略了实体间的重叠关系.为此,基于能识别重叠关系的Bi-LSTM+CRF模型,通过参数共享实现两个任务联合学习,充分利用任务间联系来优化结果.公开数据集上的实验结果表明:所提出模型在实体识别上取得了78.4%的f1值,在非重叠关系和重叠关系的抽取上取得了50.5%和45.0%的f1值.为验证该方法可后续用于金融知识图谱构建,提取了小型金融数据集来验证其在金融数据上的泛化能力.
ISSN:1674-8425
DOI:10.3969/j.issn.1674-8425(z).2020.05.018