基于多粒度建模的半监督文本分类方法研究
G254; [目的/意义]为减少文本分类任务需要的有标签样本数量,提出一种只需要少量有标签样本训练的半监督分类方法.[方法/过程]本文使用多粒度文本建模方法获取同一文本不同粒度的特征,使用集成学习的思想对基分类器进行集成,在半监督训练模块得出补入的标签,最后在预测分类模块获得最终的分类结果.[结果/结论]在两个不同的数据集下,MG-SSC(Multi Granularity Semi-Supervised Classification Model)模型在只使用少量有标签样本训练的情况下,都取得了较好的分类效果.本文提出的模型可以有效地处理半监督分类任务,为使用者降低文本分类的成本....
Gespeichert in:
Veröffentlicht in: | 现代情报 2021-06, Vol.41 (6), p.42-177 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | G254; [目的/意义]为减少文本分类任务需要的有标签样本数量,提出一种只需要少量有标签样本训练的半监督分类方法.[方法/过程]本文使用多粒度文本建模方法获取同一文本不同粒度的特征,使用集成学习的思想对基分类器进行集成,在半监督训练模块得出补入的标签,最后在预测分类模块获得最终的分类结果.[结果/结论]在两个不同的数据集下,MG-SSC(Multi Granularity Semi-Supervised Classification Model)模型在只使用少量有标签样本训练的情况下,都取得了较好的分类效果.本文提出的模型可以有效地处理半监督分类任务,为使用者降低文本分类的成本. |
---|---|
ISSN: | 1008-0821 |
DOI: | 10.3969/j.issn.1008-0821.2021.06.004 |