在我国发展的过程中,越来越注重居民的幸福感,随着“大数据”时代的到来,研究数据从以前的调查问卷变成了线上数据。本文以居民为研究对象,以居民情感为着力点,在新浪微博的数据支持下,系统全面地探索居民夜间情感的时空变化规律。首先通过使用网络爬虫采集居民微博数据,再构建微博文本情感分析模型将微博文本转化为情感倾向,最后使用ArcGis软件对居民夜间情感变化进行可视化,并结合微博文本词频,探索情感的变化规律和特征。研究表明居民在夜间的情感变化主要受饥饿程度、疲劳程度、睡眠等因素影响。
智能手机的普及、web2.0 技术的日益成熟以及移动网络的迅速发展,使得社交媒体软件迅速发展和被使用。据统计,截至2017 年6 月,中国网民人数达到7.51 亿,其中手机网民占96.3% [1],而新浪微博,截至2017 年9 月,活跃用户就达到了3.76 亿[2],占网民人数的一半以上。大量的用户在新浪微博平台上每天就会产生上万GB 的数据,这些数据包括文字、图片、视频、地理位置和个人信息等数据。由于这些数据都是用户表达自己当时的情感、所想而产生的,他人干预的因素较小,因此数据能较为真实的反映出用户当时的状态,具有较高的挖掘价值。
Rotton [3]深入的研究发现,每天的气温、天气的干燥或者潮湿、雾霾程度都可以影响居民的情绪,让居民变得更加暴躁甚至具有攻击行为;Welsch [4] [5]则利用二氧化氮气体的排放量来评估环境污染的程度,对比了54 个国家的数据,研究了居民的主观幸福感与环境污染的关系,研究结果显示,空气污染程度与居民幸福感程度成反比;刘华珍[6]从情感体验和人际关系出发,对萧山居民精神生活状态进行了深入研究,发现女性居民情感状态要比男性的好;陈映雪[7]通过微博数据分析居民情感与建成环境之间的联系;易善君[8]等人通过分析微博数据和空气数据,研究空气质量与居民情感之间的关系,得出空气中对居民情感影响较大的为颗粒物质与有刺激性气味的气体。上述都是研究居民情感与客观因素的关系,而本文则是注重研究居民情感在生活中自身的变化规律。
目前采集新浪微博数据的主要方法有两种,即新浪微博API [9]和网络爬虫[10]-[15]。由于新浪微博并没有将API 的使用权限完全对开发者开放,而且限制了API 的调用次数,导致使用新浪API 无法大量采集微博数据,故使用网络爬虫获取数据。
本文设计并实现了基于Pthon 的新浪微博爬虫,并获取了赣州市居民微博共413,450 条,所获取的微博数据内容包括:用户ID、昵称、用户所在地区、微博发布时间、微博发布位置的坐标、用户性别、用户年龄及微博文本等。为更好地将数据展示出来,现将部分数据从MongoDB数据库中导出到Excel 表中,部分微博数据如图1 所示。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !