剑客
关注科技互联网

大数据难懂?从奥巴马竞选中轻松读懂大数据

大数据难懂?从奥巴马竞选中轻松读懂大数据

作者:陈根

最近,身边一群对新科技充满好奇,却又风趣地自讽为“伪科迷”的朋友向我吐槽:已经嗅到科技平民化时代的气味了。大家都在说道着物联网、AI、虚拟现实、大数据……顿时,感觉自己连“伪”都称不上了,甚至开始有点LOW了。

其实,未来科技并没有那么神奇玄乎。今天,根哥就先来给大家科普点大数据。作为未来科技发展的趋势方向,大数据已然成为当下风靡的流行。通过下面的介绍,希望能让大家走出大数据的晦涩印象,更能在以后的谈笑中胸有成竹。

大数据源于大量的数据

大数据源于大量、快速产生的数据。从量方面来说,我们可以做个简单的核算:每一分钟,人类就会寄出二亿四百万封电子邮件,张贴240万则贴文到Facebook上,上传72小时的影片到YouTube,以及把216000张新照片放在Instagram上,这所有的一切都是大数据体系里的基础细胞。再从速度方面来看,当下全球的数据资料,有90%是在过去两年的时间里产生的;每年的数据增量都在50%以上。这一切共同打造了大数据硕大的基石。

有了大量的数据采集之后,大数据已经迅速成为互联网发展到现今阶段的一种表象或特征,简单地说,大量的数据通过云计算、预测分析等技术手段进行梳理归结,从而成为行为和决策的“指引者”。这也让大数据有了一层“先知”的光环。但是,保持一份平常心是我们探寻大数据殿堂的基本态度。

大数据,如何才有用?

大数据有用,显然是毋庸置疑的。但是,是不是只要是数据,就会创造价值呢?甚至部分人认为的,只要收集到大量的数据,就能带动社会进步。显然不是这样的。如果缺乏处理数据资料的基本能力,只有数据量的拼命增长,那么,这样的大量数据不仅意义有限,反而只会造成巨大的成本和资源浪费。而大量数据之所以能成为大数据,更重要的是,我们能通过技术手段对这些数据资料进行处理,然后作出更明智有效的决策。如若不然,数据的价值将极为有限。

就比如在我们的童年时代,考试是每个人所必须面对的“麻烦事”。而通过一次次的考试,我们其实累积了许多学业资讯,只不过当时无法把所有资料点连结起来加以分析,所以并没有产生出有特殊意义的指导性东西。同样,企业界也是如此。想想看,过去多少企业在发展过程中,寄发了多少报告信件,积累了多少方法经验,这些又都蕴含了多少商业资讯,却因无法搜寻,致使无法大规模应用。甚至被误认为是“没什么有价值的”而遭到闲置或丢弃。

大数据成就奥巴马竞选

大数据的作用到底有多大?既然企业都用不起来,那大数据还真的有用吗?也许你的心里已经开始犯嘀咕了。不过别急,接下来我们就来看看大数据在大选中是如何成就未来总统——奥巴马的。

在中国,我们可能比较难体会到国家领导人“竞选”是哪门子的事。所以,这里估且借用美国总统竞选的案例,来看看大数据的威力。而当下竞争得如火如荼的希拉里与特朗普之间尚未较量出个结果,所以,我们估且就来看看奥巴马阵营在竞选中打的大数据牌。

2012年,奥巴马阵营在激烈的竞选竞争中,充分运用大数据进行深度分析如何募款、在哪里举行选举活动、如何打广告等举措,令对手无从招架。以电邮小组为例,在选战过程中,奥巴马的18人电邮小组测试了一万多种不同版本的电邮讯息。甚至,他们针对单一电邮,发出18个不同版本的邮件,每个版本都附上不同的主旨,以测试哪一种最有效。结果最成功的标题是“对手经费快超前了”,总共募到2673278美元;表现最差的是“民调说中了一件事……”,只募得403603美元。此外,几百名数据高手和数据分析专家组成的团队还从募款到现场作战方式到民调分析等全方面出击,打得共和党候选人溃不成军。

一位电邮小组成员表示,“我们基本上发现,直觉毫无用处。”在竞选过程中,奥巴马阵营通过大数据分析,锁定目标选民及催票计划获得卓越成效;以数据为基础的募款活动更是创造出非凡成果,总共募得11.23亿美元的选举经费,其中有6亿9千万美元来自440万民众的线上捐款。奥巴马打选战的规模是共和党候选人罗姆尼的两倍,但创造出四位的成果。

大数据,真正意义在哪里?

奥巴马大选之战告捷,大数据功不可没。当然,大数据的“大”有其客观价值所在。虽然长期以来,我们一直在收集大量数据。但是,“大数据”的真正意义在于,我们能即时处理某方面的大量资讯,并设法用来做点事情。我们可以根据即时分析,策略性作出不同的决策,而不是纯粹仰赖事后的回顾性分析。过去典型的大量数据分析,例如大型研究或有些长期的持续性研究,都是事后才进行回顾性分析,而不是现有策略流程的一部分。想想看,花多年时间分析人口普查资料和打选战时利用即时分析争取选票,两者的差异有多大。

在数据收集量大增的同时,大数据的发展还有赖于电脑运算能力的成长,这两者可谓是相辅相成,相互补充。数据量日益庞大时,大家为了分析数据,并从中撷取商业情报,就会投入更多资金于强大的电脑,并储存更丰富的资料。电脑威力愈强,就愈能轻松聚积大量数据,产生更多深度资料集。当然,大数据也有其潜在矛盾,因为大数据科技兼具细密和宽广的特性,会检视许许多多的小事实,再集合有限的事实成为既观照全面又个人化的资讯。打个通俗的比方,大数据兼具显微镜和望远镜的功能:一方面协助我们检视过去观察不到的小细节,同时又能理解更大规模的数据,揭露以往因相隔太远而被忽视的相关性。

大数据的尴尬与蜕变

大数据看起来很厉害,能够让你决胜于最高级别的总统竞选。事实上也的确如此。到目前为止,大数据带给真实世界的冲击,可以说是方方面面的。比如,亚马逊和Netflix通过“推荐引擎”,为顾客提供更准确的建议;企业通过数据分析,做出相对更精准的决策。但是,就像每个人都会有自己不为人知的痛楚一样,当前的大数据也有着自己的难堪与尴尬。

据最新的调研报告显示,每天都在铺天盖地诞生的大数据,其实有59%的数据量是无效的;我们所采集的70%-85%的数据,因为过于复杂而难以有效使用;而85%的企业灵气架构无法适应数据量和复杂性增长的需要;甚至,鉴于数据分析的能力,98%的企业尚无法及时、准确地为业务提供正确的信息。

但是,今天的大数据应用还只是开端,再过不了多少年,大数据将不再只是个时髦的名词,目前似乎和数据分析不相干的生活层面,也都会被大数据一一渗透。甚至,大数据还将改变我们吃的食物,穿的方式,说话的逻辑,并且打破公共领域和私人生活的界线。

End.

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址