SemFA:基于语义特征与关联注意力的大规模多标签文本分类模型

TP391; 大规模多标签文本分类(XMTC)是从一个庞大且复杂的标签集合中查找与文本样本最相关标签的一项具有挑战性的任务.目前,基于Transformer模型的深度学习方法在XMTC上取得了巨大的成功.然而,现有方法都没能充分利用Trans-former 模型的优势,忽略了文本不同粒度下细微的局部语义信息,同时标签与文本之间的潜在关联尚未得到稳健的建立与利用.对此,提出了一种基于语义特征与关联注意力的大规模多标签文本分类模型SemFA(An Extreme Multi-Label Text Classi-fication Model Based on Semantic Features an...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:计算机科学 2023, Vol.50 (12), p.270-278
Hauptverfasser: 王振东, 董开坤, 黄俊恒, 王佰玲
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:TP391; 大规模多标签文本分类(XMTC)是从一个庞大且复杂的标签集合中查找与文本样本最相关标签的一项具有挑战性的任务.目前,基于Transformer模型的深度学习方法在XMTC上取得了巨大的成功.然而,现有方法都没能充分利用Trans-former 模型的优势,忽略了文本不同粒度下细微的局部语义信息,同时标签与文本之间的潜在关联尚未得到稳健的建立与利用.对此,提出了一种基于语义特征与关联注意力的大规模多标签文本分类模型SemFA(An Extreme Multi-Label Text Classi-fication Model Based on Semantic Features and Association-Attention).在 SemFA 中,首先拼接多层编码器顶层输出作为全局特征.其次,结合卷积神经网络从多层编码器浅层向量中获取局部特征.综合丰富的全局信息和不同粒度下细微的局部信息获得更丰富、更准确的语义特征.最后,通过关联注意力机制建立标签特征与文本特征之间的潜在关联,引入关联损失作为潜在关联不断优化模型.在Eurlex-4K和 Wiki10-31K两个公开数据集上的实验结果表明,SemFA优于大多数现有的XMTC模型,能有效地融合语义特征与关联注意力,提升整体的分类性能.
ISSN:1002-137X
DOI:10.11896/jsjkx.230300239