纪雪梅 徐新然
情报资料工作. 2018, 39(5): 41-49.
文章将社交媒体用户标注的地理位置信息与话题信息相结合,提出社交媒体话题空间分布研究的流程。首先,对用户标注的地理位置进行解析和标准化,对标准化后的地理位置信息进行统计分析以了解特定话题的地理位置分布;其次,构造“词语-文档”矩阵、“位置-文档”矩阵和“词语-位置”矩阵;第三,基于“词语-位置”矩阵通过改进的tfidf算法识别各位置区域的特征词,了解不同位置用户关注点的差异;第四,基于“词语-文档”矩阵和“位置-文档”矩阵进行整体共词网络和共词网络空间构建,结合社团发现算法识别子话题;第五,对子话题的空间分布及不同地理位置的特征话题进行分析;最后,选取“雾霾”话题,通过新浪微博数据进行实例分析。