面向社区问答的中文短文本分类算法研究
为解决社区问答系统中的问题短文本特征词少、描述信息弱的问题,本文利用雏基百科进行特征扩展以辅助中文问题短文本分类。首先通过雏基百科概念及链接等信息进行词语相关概念集合抽取,并综合利用链接结构和类别体系信息进行概念间相关度计算。然后以相关概念集合为基础进行特征扩展以补充文本特征语义信息。实验结果表明,本文提出的基于特征扩展的短文本分类算法能有效提高问题短文本分类效果。...
Gespeichert in:
Veröffentlicht in: | 现代情报 2013, Vol.33 (10), p.70-74 |
---|---|
1. Verfasser: | |
Format: | Artikel |
Sprache: | chi |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | 为解决社区问答系统中的问题短文本特征词少、描述信息弱的问题,本文利用雏基百科进行特征扩展以辅助中文问题短文本分类。首先通过雏基百科概念及链接等信息进行词语相关概念集合抽取,并综合利用链接结构和类别体系信息进行概念间相关度计算。然后以相关概念集合为基础进行特征扩展以补充文本特征语义信息。实验结果表明,本文提出的基于特征扩展的短文本分类算法能有效提高问题短文本分类效果。 |
---|---|
ISSN: | 1008-0821 |
DOI: | 10.3969/j.issn.1008-0821.2013.10.016 |