基于突发短语挖掘的微博事件检测方法研究
[目的/意义]微博是网络舆情传播的重要平台之一,为了对海量微博中的突发舆情事件进行监控预警,并获取开源情报.[方法/过程]文章以短语作为兴趣词项,提出了基于突发短语挖掘的微博舆情事件检测方法.首先,利用自动短语挖掘方法AutoPhrase从微博文本中识别出具有潜在舆情价值的优质短语;然后,基于短语相关统计信息,识别出主题性、流行性、突发性均较大的高舆情价值的突发短语集合;最后,构建突发短语共现网络,利用模块度优化算法对短语聚类,从而得到不同的舆情事件.[结果/结论]基于推特数据的实验结果表明,与基于单词和命名实体的方法相比,该方法可以获得更好的事件检测效果.[局限]仅针对特定主题的英文推特数据...
Gespeichert in:
Veröffentlicht in: | 情报理论与实践 2021-12, Vol.44 (12), p.172-179 |
---|---|
Hauptverfasser: | , , , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | [目的/意义]微博是网络舆情传播的重要平台之一,为了对海量微博中的突发舆情事件进行监控预警,并获取开源情报.[方法/过程]文章以短语作为兴趣词项,提出了基于突发短语挖掘的微博舆情事件检测方法.首先,利用自动短语挖掘方法AutoPhrase从微博文本中识别出具有潜在舆情价值的优质短语;然后,基于短语相关统计信息,识别出主题性、流行性、突发性均较大的高舆情价值的突发短语集合;最后,构建突发短语共现网络,利用模块度优化算法对短语聚类,从而得到不同的舆情事件.[结果/结论]基于推特数据的实验结果表明,与基于单词和命名实体的方法相比,该方法可以获得更好的事件检测效果.[局限]仅针对特定主题的英文推特数据进行了实验验证. |
---|---|
ISSN: | 1000-7490 |