美国总统大选也变成了大数据科学家的角斗场

电子说

1.2w人已加入

描述

‍‍‍近年来,大数据在各行各业落地开花,得到了广泛的应用。美国总统大选也变成了大数据科学家的角斗场。2016年的美国总统竞选中,希拉里·克林顿采用了大数据分析来优化竞选策略,然而她还是败给了唐纳德·特朗普。这篇发表于牛津出版社博客(OUP Blog)的最新文章,对其失败的原因进行了分析。

本文作者加里·史密斯是美国波莫纳学院经济学教授,耶鲁大学经济学博士。主要从事金融市场效率,统计谬误和数据滥用方面的研究。累计发表学术论文80余篇,专著12本。他的评论文章曾发表于福布斯杂志、纽约时报、华尔街日报、商业周刊等。史密斯是牛津大学出版社即将出版的新书《The AI Delusion》的作者。

How Trump beat Ada's big data

2008年的民主党总统初选本该是希拉里·克林顿的加冕典礼。她是当时胜算最大的总统候选人,党内支持率最高且竞选资金雄厚。

然而希拉里并未如愿以偿。一位名不见经传的黑人男子——贝拉克•奥巴马最终赢得民主党总统候选人提名。奥巴马在随后的总统选举中一举击败共和党候选人约翰·麦凯恩。让人难以抗拒的个人魅力和一流的演讲口才是奥巴马的制胜秘诀,而大数据在竞选中扮演的角色似乎更为重要。

奥巴马的竞选团队收集了每位潜在选民的个人信息并录入数据库,包括:年龄、性别、婚姻状况、种族、宗教信仰、地址、职业、收入、车辆信息、房屋价值、捐赠历史、杂志订阅、休闲活动、脸书好友以及能找到的任何其它相关的信息。

竞选团队每周对潜在选民进行电话调查,试图测算出每个人投票的可能性及将票投给奥巴马的概率。在统计学上,选民的投票倾向与某些个人特性紧密相关,利用大数据建模就能推断出潜在选民的投票倾向。因此,奥巴马竞选团队能够利用数据库中的选民信息,建模分析并预测每位选民的投票可能性及支持奥巴马的概率。

这种数据驱动的分析模式使得奥巴马的竞选团队能精准地定位到每位选民,并采取有针对性的措施(电子邮件、普通邮件、面对面拜访或电视广告)来影响他们,从而获得政治捐款或是鼓动投票。2008年1月是总统大选的关键时期,这时奥巴马就已筹集到3600万美元捐款,创下候选人筹款纪录,这一数额几乎是希拉里筹款额的3倍。在奥巴马获得提名后,筹款仍在继续。2008年全年,奥巴马共筹集到7.8亿美元捐款,是其竞选对手约翰·麦凯恩募集金额的两倍多。单就筹款金额而言,麦凯恩已毫无胜算,最终奥巴马以365票对173票战胜麦凯恩赢得大选。

8年后,希拉里·克林顿再次参加总统大选,并利用大数据助阵。

希拉里的竞选团队聘请了60位数学家和统计学家,其中几位曾为奥巴马服务过,他们开发了一款名为“阿达”(Ada,为纪念19世纪的女数学家阿达·洛芙莱斯)的软件程序。若成功当选美国历史上首位女总统,希拉里将向世人炫耀“阿达”就是其成功的秘诀。多么棒的故事!

希拉里竞选团队

希拉里的竞选团队将70%的竞选资金用于电视广告,而这些广告上花费的每一美元都由“阿达”来决定。团队并没有征求有经验的媒体顾问的建议。

没有人知道“阿达”是如何作出这些决策的,但人们深信,分析了海量数据的她功能非常强大。所以,人们觉得她就像一个无所不知的女神。无需置疑,只需听从。

我们都知道,在“阿达”的程序设计中,蓝领选民是民主党稳定的票仓,因为一直以来他们都支持民主党,上一次投给了奥巴马,所以这次也会一如既往地支持希拉里。有了蓝领选民的绝对支持,希拉里只要说服少数派和自由派精英为其投票就能胜选。 

民主党数据分析公司官网

然而这一次,大数据失败了。

“阿达”只是一个计算机程序,和所有计算机程序一样,它们都缺乏常识,或者说并没有智慧。任何一个关注总统选举的人都注意到希拉里在与伯尼·桑德斯的对决中险些败下阵来,而伯尼·桑德斯只是一位来自佛蒙特州的籍籍无名的74岁参议员,而且他还是一名社会主义者。在他决心挑战希拉里之前,甚至还不是民主党人。对于这样一匹黑马,人们肯定会试着弄清楚为什么桑德斯能做得这么好,然而“阿达”忽略了这些。

当希拉里在密歇根州初选中被桑德斯击败时,那些经验丰富的政治专家和竞选工作人员们显然知道原因。他们实地与选民沟通过后,就能感受到桑德斯的民粹主义倾向所拥有的巨大的吸引力,并且知道不能想当然地认为蓝领选民一定会支持民主党,然而“阿达”却没有注意到这些。

“阿达”的分析数据只覆盖了希拉里的拥趸,并没有考量更大规模人群情绪的变化。因此,首先是桑德斯被忽略,后来则是唐纳德·特朗普。因为“阿达”的分析模型中没有衡量热情的参数,即使是大数据也无法识别出选民的能量和激情。这就意味着希拉里数据驱动的竞选策略缺失了对选民能量和激情的考量。对于一台计算机而言,如果某些参数无法测量,就不会纳入分析范围。

比尔·克林顿可能是我们见过最好的总统竞选者,然而令人费解的是,希拉里竞选团队里的数据呆子们偏偏对他的意见充耳不闻。比尔在1992年竞选中挑战寻求连任的乔治·H·W·布什总统,当时他提出的竞选口号就是:“笨蛋,根本问题是经济”。比尔本能地知道选民的重要性,并知道如何说服这些群体将票投给他。

在2016年美国总统选举中,比尔·克林顿看到了伯尼·桑德斯和唐纳德·特朗普在工薪阶层选民中所激发出的热情,他及时提议将经济作为希拉里竞选团队的核心议题,特别是面对中西部“锈带”州的选民时。俄亥俄州、宾夕法尼亚州、密歇根州和威斯康星州,即所谓的“蓝墙”——民主党最忠实的票仓,阿达认为这些州将是希拉里战胜特朗普的基础。

“阿达”的分析结果认为,相比选民对自己工作问题的担忧,他们显然更担心特朗普的举止“不够总统”。所以希拉里将其竞选活动的焦点放在丑化特朗普上,试图传递一个信息:“嘿,我可能不完美,但特朗普更糟。”

希拉里在密歇根和威斯康星两个州落败于桑德斯时就应该警惕,然而她的竞选团队却完全忽视了这些。相反,希拉里团队浪费了大量时间和资源在亚利桑那州等地,她在这些地方的胜算并不高(事实也并没有赢)。之所以采取这样的竞选策略,很大程度上是因为希拉里的竞选团队过度依赖于“阿达”的分析结果。

在此之后,有一位民主党民意测验专家说:“希拉里忽视选举人票和冷落密歇根和威斯康星等州是大选中的重大决策失误。 ”

在特朗普获胜之后,比尔·克林顿迁怒于竞选团队中的那群数据呆子,他们只关注计算机程序,却忽视了数百万失业或担心失业的工人们。据报道,在与希拉里的一次通话中,比尔非常生气,以至于他将手机从阿肯色州顶层公寓的窗户扔了出去。

大数据并不是灵丹妙药。特别是当大数据隐藏在计算机内部时,人们虽然对现实世界了如指掌,但是对于计算机对数据做了什么却一无所知。

计算机在解决某些问题上的确能力超群,并且每天都在为我们赋能。然而过度迷信大数据的失败案例中,希拉里·克林顿不是唯一一个,也肯定不会是最后一个。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分