×

社交网络大数据的应用到底有多大的价值

消耗积分:5 | 格式:docx | 大小:0.02 MB | 2020-03-27

闫俊洲

分享资料个

  随着互联网技术高速的发展,网民的数量呈指数上升,社交网络进入了强调用户参与和体验的时代。所谓社交网络是一种在信息网络上由社会个体集合及个体之间的连接关系构成的社会性结构。社交网络的诞生使得人类使用互联网的方式从简单的信息搜索和网页浏览转向网上社会关系的构建与维护,以及基于社会关系的信息创造、交流与共享。它不但丰富了人与人的通讯交流方式,也对社会群体的形成与发展方式带来了深刻的变革。

  移动互联网时代,UGC(用户产生内容)不断发展,社交网络(Social Network)已经不断普及并深入人心,用户可以随时随地在网络上分享内容,由此产生了海量的用户数据。面对大数据时代的来临,复杂多变的社交网络其实有很多实用价值。

  看一组数据:微信每分钟395833人登录微信,19444人在进行视频或语音聊天;新浪微博每分钟发出(或转发)64814篇微博;Facebook用户每天共享的东西超40亿;Twitter每天处理的数据量超3.4亿;Tumblebr博客作者每分钟发布2.7万个新帖;Instagram用户每天共享3600张新照片。。。。。。

  由此可以看出,社交网络生成的用户数据的价值已远远大于平台本身。相对于搜索、电商等大数据,社交用户行为数据传导路径更短,具有更高的价值。

  1、社交网络平台的多样化,社交网络大数据也多元化

  随着移动互联的发展,各种同质化异化的社交网络平台的不断涌现,QQ、微信、新浪微博、Facebook、Twitter、Instagram等等,虽然都是网络社交平台,但是交流的侧重点又不一样,因此产生了大量的社会学、传播学、行为学、心理学、人类学、舆论学等众多领域的社交数据。各行业的企业都倾注了大量的心血在这些数据进行挖掘分析,从而更加比较精确地把握事态的动向,找准营销对象。

  典型的案例之一:社交网络大数据颠覆美国总统竞选定律

  号称“世界上最民主的国家”的美国,有着这样的总统选举铁律:谁花的钱越多,赢得选举的几率就越大。但是,2012年美国总统奥巴马的再次当选创造了一个奇迹:在他获胜前的 70 年时间里,还没有一位美国总统能够在全国失业率高于 7.4% 的情况下连任成功;而在整个竞选过程中,奥巴马团队的花销不到3 亿美金,竞争对手罗姆尼花了近 4 亿美金却仍然败选!

  2、探码大数据技术基于社交网络大数据顺势而为

  随着社交网络大数据的多元化发展,各个领域对社交网络大数据的需求呈现出巨大的增长趋势。因此如何将这些数据运用起来,才是各领域学者专家企业最为关心的事。基于社交网络大数据的技术——探码大数据处理平台,采用先进的网络爬虫技术,分布式计算能力,针对定制的目标数据源进行网络信息的数据采集、数据提取、数据挖掘、数据处理,从而为各种信息服务系统提供数据输入。在社交网络大数据的应用上,力图为使用者提供更加便捷和直观的数据分析结果。

  数据采集

  对来自社交网络平台的数据附上时空标志,去伪存真,尽可能收集异源甚至是异构的数据,必要时还可与历史数据对照,多角度验证数据的全面性和可信性。

  数据提取

  要达到低成本、低能耗、高可靠性目标,通常要用到冗余配置、分布化和云计算技术,在存储时要按照一定规则对数据进行分类,通过过滤和去重,减少存储量,同时加入便于日后检索的标签。

  数据挖掘

  基于对用户的结构和行为特征深入挖掘,通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现隐藏中的有用数据。

  数据处理

  有些社交网络的数据涉及上百个参数,其复杂性不仅体现在数据样本本身,更体现在多源异构、多实体和多空间之间的交互动态性,难以用传统的方法描述与度量,处理的复杂度很大,需要将高维图像等多媒体数据降维后度量与处理,利用上下文关联进行语义分析,从大量动态而且可能是模棱两可的数据中综合信息,并导出可理解的内容。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !