滕 婕, 胡广伟, 王 婷
[目的/意义]高效准确地把握社会诉求转变节点、识别社会诉求主题、追踪主题演化趋势,进而为政府服务
和社会治理的和谐有序发展提供支撑已成为一项重要议题。[方法/过程]提出了一套基于语义依赖关系的主题识
别和演化路径分析方法。首先,针对同一文档核心词汇,利用全组合方法构建“Source-Target”词对,通过时间区
间划分和Word2Vec模型构建动态语义依赖关系网;其次,利用社区发现算法识别每一区间中语义依赖网的子社
区,并采用PageRank算法识别出每一子社区的主题标签,通过测量前后相邻时间区间主题相似度来反映主题的
演化关系,展示主题生成、分裂、融合、衰亡的演化过程;最后,以甘肃省人民政府公开的省长信箱数据进行模型验
证,通过与K-means方法在主题识别效果上进行比较,并利用精确率、召回率和F1值进行方法效果评测。[结果/
结论]研究结果发现,本方法应用效果的提升差额曲线均大于0,且三项指标的差额曲线整体都处在0.5分界值之
上,取得了明显的优化效果。研究为政府网站领导信箱模块反映的公众关切事项构建了全景视图,该方法也为探
索其它社交文本挖掘方法以及支撑国家治理大数据分析实践提供了新的思路。