弹幕视频的情感时间曲线聚类与传播效果

TP393%G250; [目的]构建面向弹幕文本的情感曲线聚类模型,为视频传播效果预测提供新的决策方式.[方法]提出词向量扩充领域情感词典,优化情感分类器性能;采用综合权重等手段使情感时序平稳平滑;提出SBD度量K-shape聚类模型,分析情感时序模式、特征及传播效果.[结果]优化情感词典模型在多分类指标(主客观、极性分类)上F1值分别达到0.89和0.79,主客观分类器性能提升123%.对比多种时序度量聚类算法组合,SBD度量K-shape聚类模型在戴维森堡丁指数和轮廓系数指标上均性能更优.[局限]情感词典算法未完全考虑网络流行语或不含中心形容词的句子情形,情感时序聚类结果描述、解释程度需要...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:数据分析与知识发现 2022, Vol.6 (6), p.32-45
Hauptverfasser: 张腾, 倪渊, 莫同, 吕学强
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:TP393%G250; [目的]构建面向弹幕文本的情感曲线聚类模型,为视频传播效果预测提供新的决策方式.[方法]提出词向量扩充领域情感词典,优化情感分类器性能;采用综合权重等手段使情感时序平稳平滑;提出SBD度量K-shape聚类模型,分析情感时序模式、特征及传播效果.[结果]优化情感词典模型在多分类指标(主客观、极性分类)上F1值分别达到0.89和0.79,主客观分类器性能提升123%.对比多种时序度量聚类算法组合,SBD度量K-shape聚类模型在戴维森堡丁指数和轮廓系数指标上均性能更优.[局限]情感词典算法未完全考虑网络流行语或不含中心形容词的句子情形,情感时序聚类结果描述、解释程度需要进一步加深.[结论]基于领域情感词典-SBD-Kshape算法可以削弱弹幕文本非规整噪声及时序相位偏移的影响,聚类结果可作为识别传播效果差异的依据.
ISSN:2096-3467
DOI:10.11925/infotech.2096-3467.2021.0793