弹幕视频的情感时间曲线聚类与传播效果
TP393%G250; [目的]构建面向弹幕文本的情感曲线聚类模型,为视频传播效果预测提供新的决策方式.[方法]提出词向量扩充领域情感词典,优化情感分类器性能;采用综合权重等手段使情感时序平稳平滑;提出SBD度量K-shape聚类模型,分析情感时序模式、特征及传播效果.[结果]优化情感词典模型在多分类指标(主客观、极性分类)上F1值分别达到0.89和0.79,主客观分类器性能提升123%.对比多种时序度量聚类算法组合,SBD度量K-shape聚类模型在戴维森堡丁指数和轮廓系数指标上均性能更优.[局限]情感词典算法未完全考虑网络流行语或不含中心形容词的句子情形,情感时序聚类结果描述、解释程度需要...
Gespeichert in:
Veröffentlicht in: | 数据分析与知识发现 2022, Vol.6 (6), p.32-45 |
---|---|
Hauptverfasser: | , , , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | TP393%G250; [目的]构建面向弹幕文本的情感曲线聚类模型,为视频传播效果预测提供新的决策方式.[方法]提出词向量扩充领域情感词典,优化情感分类器性能;采用综合权重等手段使情感时序平稳平滑;提出SBD度量K-shape聚类模型,分析情感时序模式、特征及传播效果.[结果]优化情感词典模型在多分类指标(主客观、极性分类)上F1值分别达到0.89和0.79,主客观分类器性能提升123%.对比多种时序度量聚类算法组合,SBD度量K-shape聚类模型在戴维森堡丁指数和轮廓系数指标上均性能更优.[局限]情感词典算法未完全考虑网络流行语或不含中心形容词的句子情形,情感时序聚类结果描述、解释程度需要进一步加深.[结论]基于领域情感词典-SBD-Kshape算法可以削弱弹幕文本非规整噪声及时序相位偏移的影响,聚类结果可作为识别传播效果差异的依据. |
---|---|
ISSN: | 2096-3467 |
DOI: | 10.11925/infotech.2096-3467.2021.0793 |