邬贺铨:大数据驱动与互联网思维

作者:未知 更新时间:2018-02-09 16:49:32 来源:宣讲家 【字号: 】 浏览

大数据在环保中的应用

美国用无线传感器在密西西比河的水底和水面取样,随后将水质监测结果用卫星回传至后台,利用大数据挖掘等技术分析得出河流的污染状况,并建立了一个数字化河流的模型。这样,点击数字化河流模型的任一点,即可得知其污染情况。实际上,我国上海、无锡等地也做了类似监测。比如,无锡在太湖上也固定放置了一些传感器, ,监测不同位置的水质污染状况,并将这些数据传到网上,供有关方面了解该处水质污染情况。

从2007年至2012年我国大气污染状况看,京津冀地区的人口密度是世界平均值的10倍,煤耗空间密度(单位国土面积上消耗的煤炭)是世界平均值的30倍,汽车空间密度也超过了美国。2015年北京空气质量达标天数186天,占全年天数的51%。根据现在的污染治理情况估计,北京的空气质量要全年达标需到2030年。现在,北京市委市政府加大了大气污染的治理力度。

大数据在医疗上的应用

大数据在流行病预测中的应用。谷歌比美国疾控中心还早一周发布了某一时段、某一城市的流感状况数据,相似度达到97%。那么,谷歌是根据什么来发布的呢?就是根据搜索词的突发性来判断这个地方所出现的问题。一个地方出现流感,很多人都会上网搜索,了解流感的症状,到哪个医院去看病更好?吃什么药能够缓解症状?一时之间,关于“流感”这个关键词的搜索频率比其他地方、其他时间会高出很多。谷歌就是根据这一点通过大数据分析判断这个地方的流感状况。百度也是采用这一方法统计分析我国艾滋病感染人群的分布状况。一些人感染了艾滋病或是怀疑自己感染了艾滋病,不愿意去医院,偷偷地上网咨询艾滋病的症状、治疗方法等。百度通过数据挖掘、分析得到了卫生部门都无法掌握的信息。从百度发布的数据看,我国艾滋病感染人群最密集的地方是云南和河南。

大数据与个性化医疗。我们每个人的基因、代谢以及对药物的反应都是不一样的。即使医生的诊断、治疗方法都正确,也未必会有效。同样的治疗对一些病人来说基本上是无效的,如75%的癌症患者、70%的老年痴呆患者、50%的关节炎患者、43%的糖尿病患者、40%的哮喘病患者、38%的抑郁症患者。大家知道,苹果公司总裁乔布斯在发现患上胰腺癌之后,到医院花费几十万美元做了DNA检测,获得自身全部DNA数据。他说,我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个用这种方式但仍然死于癌症的人。虽然他没有战胜癌症,但这个方法将他的生命延长了8年。2015年,美国奥巴马政府启动了基于基因的“精准医疗计划”。也就是说要对应你的基因开展精准医疗。当年,乔布斯花费几十万美元做DNA检测,2014年美国的报价是1000美元,到2016年可能就只有100美元。

GE公司通过统计分析全球不同人群、不同部位、不同扫描方式的CT效果,给出建议剂量。在比利时的CT实验室发现可将全年的CT的扫描剂量降低41%,从而避免可能发生的CT剂量不当的致癌风险。2015年,百度宣布了一项与北京协和医院联合发起的食管癌研究项目,将提供食管癌从预测到诊断、从诊断到治疗的整个医疗闭环的数据支持。

大数据在商业上的应用

我们在商业网站上的很多数据都被商家利用了。淘宝统计分析用户的IP地址、浏览和购买记录等数据,不仅自用,还出售给有关商家。无论你上哪个网站,即使这个网站与淘宝没有关系,但跟某商家有广告合作,就会弹出与你在淘宝、京东等上所浏览、购买商品有关的广告信息。

美国第二大超市Target分析认为,女性是最好的顾客,而怀孕的女性最舍得花钱买东西。因此,Target超市根据孕妇的购买习惯和偏好,选出孕妇经常购买的典型商品,建立怀孕预测指数,针对性地派送孕妇用品的优惠广告。有一天,一位老人气冲冲地来到Target超市某分店,跟总经理说,我家里只有一个上初中的女孩,你们却把孕妇及婴幼儿商品的样品送到家里。总经理就跟他解释说,我们的大数据分析也有搞错的时候。但不到一个星期,这位老人便在《纽约时报》上登报道歉,说我错怪这个公司了,我忽然发现我女儿意外怀孕了。这个例子说明日常的购物行为产生的大数据也是可以分析利用的。

大数据提供机器翻译服务

原来,计算机通过学语法、查字典完成翻译,但这并不是好办法。谷歌凭借其海量数据库,找出相关的文章及对应译本,建立多语言数据间的语法和文字对应规律,将语言视为能判别可能性的数据,将语义挑战变成数学问题。比如,你要写一篇关于三亚旅游的文章,我给你找一篇关于腾冲旅游的文章,改一下就行了。你要是想写成英文的,那我就找类似的英文文章再改一下。小孩子学说话,就是模仿,根本不学语法。另外,Facebook也开发了相关技术——“多语言作曲家”工具,如果用户使用中文发布帖子,并选择将内容翻译成日语,那么将默认语言设置为日语的用户就可以看到该帖子。现在,百度也可以。“百度翻译”能够提供24种语言的翻译,但整个百度翻译团队却无人能懂其中的12种语言。

我们每天都会收到很多邮件,有些邮件并不重要,但不回复的话就显得不礼貌。现在,谷歌邮箱应用Inbox能够自动分析来信内容,并起草三封回信,而我们只需要选择其中一封,按一下发送键就行了。