邬贺铨:大数据驱动与互联网思维

作者:未知 更新时间:2018-02-09 16:49:32 来源:宣讲家 【字号: 】 浏览

大数据在热点监测中的应用

利用短信、微博、微信和搜索引擎可以收集热点事件与舆情挖掘。通过对微博用户建立档案,提前关注可能引起社会不稳定的因素。腾讯通过微博、微信用户的IP地址、所发帖子分析得出他们的性别、年龄、职业和所在地址等信息,并以此为用户建立档案。根据网上一些信息的大数据分析,可以掌握一个人的背景和行为,这对于政府的维稳管理是十分有帮助的。

长假来临前,很多人都会上网搜索旅游景点、酒店、火车、飞机、自驾游路线等信息,由此可预知哪些旅游景点会人满为患,哪些交通路线会拥堵不堪。2012年国庆长假前一周,百度发现“华山”搜索量激增,认为华山景区在应对大量游客中可能会出现问题,果然发生了华山拥堵事件。2013年国庆长假前4天,百度发现搜索“九寨沟”的人非常多,于是预测九寨沟要出事,结果九寨沟景区也发生了拥堵事件。2013年5月,昆明市民上街抗议“PX化工项目”上马,而百度提前一周便从当地市民对该项目搜索关注程度的剧增,判断出该项目的推进会出问题。现在,一些地方政府找到百度,希望百度能为自己提供长假旅游、社会治安等方面的大数据预警。

大数据与治安管理

2013年8月,美国《大西洋月刊》报道了一个事件。纽约一对夫妇分别在谷歌上曾搜索“高压锅”和“背包”,一天后联合反恐部队6人上门盘问是否拿高压锅做炸弹。为什么?因为波士顿马拉松爆炸事件的犯罪嫌疑人就是将装有爆炸装置的高压锅藏在背包中,在袭击地点引爆的。所以,同一IP地址,尽管在不同时间搜索“高压锅”和“背包”,美国安全部门都会把这两个关键词与恐怖袭击联系起来。

2012年美国加州大学帮助洛杉矶警察局分析洛杉矶市过去发生的1300万起案件,找到了各街区案件发生与时间、天气、交通状况及其他相关事件的关系,建立犯罪活动预测平台,使当地财产犯罪率和盗窃案件分别下降了12%和26%。另外,美国还利用大数据技术来缉毒。为了避免被警察发现,美国的毒品种植由露天转为豪宅之内盆栽大麻,利用LED灯进行光合作用,一年就能赚回或买或租豪宅的费用。由于一般家庭用电是白天用得少,晚上用得多,而毒品种植是白天晚上都要大量用电。据此,美国警察利用供电公司提供的每户智能电表统计用电量与用电模式的数据,判断这个建筑物是否有问题,从而一举捣毁毒窝。

大数据在反恐中的应用

在反恐应用中,一般都是利用关键词搜索分析,但这也不是很管用,主要是因为计算机没有人的思维,在分析文字中常常出现问题。某企业不能做到给每位员工配备一台电脑,于是一个员工就给老板发了条信息说:“我申请一台独立电脑”,后台的计算机因“台独”二字而把信息拦截。未来的大数据分析需要人机结合,需要更多的人工智能,需要人的感情。

计算机通过关键词分析文字都有困难,那分析照片、视频就更难了。暴恐音视频是反恐应用中难度最大的,也是政府有关部门最头疼的。以往,甄别暴恐音视频只能靠人,现在谷歌研发出一种机器学习算法,能自动生成图片、视频的题注说明,准确描述图像内容。这将有助于搜索引擎快速找出网上的暴恐图片与视频。

大数据与政治

回顾四年前的美国大选,当时,奥巴马与共和党总统候选人竞选,在大选还未结束时,网上民调显示,奥巴马的胜算是47.9%,罗姆尼的胜算是47.4%。奥巴马竞选团队的数千名志愿者,向斯坦福大学借了66000台计算机,通过社交网络和微博等收集选民的爱好和信息关注点,用计算机分析数据并建立选民档案。如果某个选民在Facebook或者Twitter上的大部分帖子都是关于环保和医疗的,那奥巴马团队就会以奥巴马的名义给他发电子邮件,专门谈论相关问题,让他感受到奥巴马想我之所想,使他有理由支持总统连任。

大数据还可以分析舆情。美国微软纽约研究院的经济学家根据网络舆情,提前一周预测2012年美国总统选举结果,51个州命中50个,准确率达98%。另外,在连续三年的奥斯卡预测中,除了最佳纪录片、最佳动画片,其他奖项均预测准确。

大数据与台湾地方选举。2014年11月,台湾地方选举开票前一周, “谷歌指数”基于候选人在谷歌和YouTube的相关搜索量及在谷歌中被讨论的次数计算,以此预测选举情况。“谷歌指数”分析,在台北,连胜文得分88分,柯文哲得分95分,最终开票结果为连胜文60.7万票,柯文哲84.8万票,连胜文输了。“谷歌指数”分析,在新北,朱立伦得分84分,游锡堃得分81分,最终开票结果为朱立伦95.9万票,游锡堃93.4万票,朱立伦险胜游锡堃。由此可见,在投票前一个星期,通过数据分析就已知晓台湾地方选举的结果了。所以,我们完全可以利用大数据分析舆情,知道老百姓的想法。