基于动态语义依赖关系网的社会诉求主题识别与演化路径分析

[目的/意义]高效准确地把握社会诉求转变节点、识别社会诉求主题、追踪主题演化趋势,进而为政府服务和社会治理的和谐有序发展提供支撑已成为一项重要议题.[方法/过程]提出了一套基于语义依赖关系的主题识别和演化路径分析方法.首先,针对同一文档核心词汇,利用全组合方法构建"Source-Target"词对,通过时间区间划分和Word2Vec模型构建动态语义依赖关系网;其次,利用社区发现算法识别每一区间中语义依赖网的子社区,并采用PageRank算法识别出每一子社区的主题标签,通过测量前后相邻时间区间主题相似度来反映主题的演化关系,展示主题生成、分裂、融合、衰亡的演化过程;最后,以甘...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:情报资料工作 2022, Vol.43 (3), p.20-33
Hauptverfasser: 滕婕, 胡广伟, 王婷
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:[目的/意义]高效准确地把握社会诉求转变节点、识别社会诉求主题、追踪主题演化趋势,进而为政府服务和社会治理的和谐有序发展提供支撑已成为一项重要议题.[方法/过程]提出了一套基于语义依赖关系的主题识别和演化路径分析方法.首先,针对同一文档核心词汇,利用全组合方法构建"Source-Target"词对,通过时间区间划分和Word2Vec模型构建动态语义依赖关系网;其次,利用社区发现算法识别每一区间中语义依赖网的子社区,并采用PageRank算法识别出每一子社区的主题标签,通过测量前后相邻时间区间主题相似度来反映主题的演化关系,展示主题生成、分裂、融合、衰亡的演化过程;最后,以甘肃省人民政府公开的省长信箱数据进行模型验证,通过与K-means方法在主题识别效果上进行比较,并利用精确率、召回率和F1值进行方法效果评测.[结果/结论]研究结果发现,本方法应用效果的提升差额曲线均大于0,且三项指标的差额曲线整体都处在0.5分界值之上,取得了明显的优化效果.研究为政府网站领导信箱模块反映的公众关切事项构建了全景视图,该方法也为探索其它社交文本挖掘方法以及支撑国家治理大数据分析实践提供了新的思路.
ISSN:1002-0314
DOI:10.12154/j.qbzlgz.2022.03.002