基于多粒度建模的半监督文本分类方法研究

G254; [目的/意义]为减少文本分类任务需要的有标签样本数量,提出一种只需要少量有标签样本训练的半监督分类方法.[方法/过程]本文使用多粒度文本建模方法获取同一文本不同粒度的特征,使用集成学习的思想对基分类器进行集成,在半监督训练模块得出补入的标签,最后在预测分类模块获得最终的分类结果.[结果/结论]在两个不同的数据集下,MG-SSC(Multi Granularity Semi-Supervised Classification Model)模型在只使用少量有标签样本训练的情况下,都取得了较好的分类效果.本文提出的模型可以有效地处理半监督分类任务,为使用者降低文本分类的成本....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:现代情报 2021-06, Vol.41 (6), p.42-177
Hauptverfasser: 余本功, 汲浩敏
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:G254; [目的/意义]为减少文本分类任务需要的有标签样本数量,提出一种只需要少量有标签样本训练的半监督分类方法.[方法/过程]本文使用多粒度文本建模方法获取同一文本不同粒度的特征,使用集成学习的思想对基分类器进行集成,在半监督训练模块得出补入的标签,最后在预测分类模块获得最终的分类结果.[结果/结论]在两个不同的数据集下,MG-SSC(Multi Granularity Semi-Supervised Classification Model)模型在只使用少量有标签样本训练的情况下,都取得了较好的分类效果.本文提出的模型可以有效地处理半监督分类任务,为使用者降低文本分类的成本.
ISSN:1008-0821
DOI:10.3969/j.issn.1008-0821.2021.06.004