“慢数据”挖掘会让我们避免下一场H1N1么?
2014-06-01 09:43

“慢数据”挖掘会让我们避免下一场H1N1么?

当下一场变异性流感等流行病大规模爆发之前,通过周围的大数据监测和预测周边疫情动态,人们再也不必恐慌和担心被传染,早就有相应提示及时应对预防;而与此密切相关的医疗行业,可以及时获悉疾病爆发趋势,合理分配和部署好医务人员,同时提醒和建议市民预防疫病,降低人们染病几率……

这一幕将不仅仅只出现在好莱坞的科技大片里,而是在刚结束的2014年百度联盟峰会中,百度的新技术给大家展示的未来新的生活蓝图。会议上李彦宏针对大数据等主题发表了演讲,在这其中,特别能引人注意的是提到了大数据和医疗的结合,因为医疗与我们每个人密切相关,李彦宏提到:“未来真正的大数据积累应该是可以提前预测人的疾病情况,因为疾病不是一天出现的,而是天长日久累计出来的,各种数据一定发生变化”。同时他又提到:“有价值的数据,不是无用的信息爆炸,而是有价值的慢数据,可以预测个性化信息的数据。”在大数据之上的慢数据才是真正有价值的,那么,究竟大数据和慢数据会对我们的生活产生什么样的影响呢?

挖掘“慢数据”的价值

大数据(big data)是指信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。目前,百度也公开发布了大数据引擎技术,具体为开放云、数据工厂、百度大脑,它将基础设施能力、软件系统能力、智能算法技术整合于一体,通过大数据引擎开放出来之后,如果已经有大数据的行业,他们可以将自己的数据导入到这个引擎进行综合性处理,引擎成了各行业海量数据的汇集、整合、处理、分析的枢纽中心。

如果一些企业在没有大数据,可以使用百度采集的大数据及成果。李彦宏提到过去两年人类产生的数据占到全部人类文明的90%,现在处于数据爆炸时代,非常多,也解决了很多问题,这种观点有点“误导”大众的感觉。

据李彦宏在联盟峰会上指出,现在每天产生大量数据,但很多是没有价值的数据,这些数据没有显示出足够的威力。纵观相关行业里,医疗行业尤其是流行病的疾控和预警是表现最为明显的也是最需要急切的,因为健康和每个人、每个家庭、每个城市、每个国家都息息相关。例如我们每天刷牙,如果能够通过牙刷等人工智能设备收集唾液的一些样本,通过体温等指标这样的“慢数据”才具有医学和参考价值。医学领域“生理数据”比“物理数据”更有实用价值。

疾控现状:

由于现代医学技术的高度发达和迅猛发展,在大多数人心里,大规模流行病的发生好像是很遥远的事。但事实证明,它从不曾离我们远去。据世界卫生组织数据,在2009年发生的那场H1N1流感(国内又称猪流感)里,全球造成至少12220人死亡,一周内新增死亡人数704人,全球股市因此下跌10%左右。有数据显示,在全球,随着人口增长和日益加快的城市化进程致使数亿人居住环境卫生恶化,疾病随着人口的增长以及人们向拥挤的城市迁移而肆虐。容易在人群中传播的疾病如流感都容易在城市中流行。在这其中,中国是表现最为明显的国家之一,由于人口众多,随着经济的发展,人员跨区域流动性加大、城市化加剧、城市人口密度增加、结构变化等都加剧了流行病发生、传播、蔓延的几率及传播速度。同时科学技术的进步、医疗手段的提高、抗生药物等广泛使用,也加速了病毒、细菌等病原体的扩散、变异和进化,出现一系列新的致命新病原体感染传播。过去十多年发生的各种大规模流行病历历在目:SARS、甲型H1N1流感、手足口病、H7N9禽流感等,几乎每隔一段时间,流行病就会以不同的形式卷土重来一次。

去年卫生部发言人就曾提到:“中国面临传统流行病威胁持续存在、新发流行病不断出现的严峻形势。”基于原有监控系统和流程的卫生防疫系统已经有些力不从心跟不上节奏,基于互联网大数据的流行病监测就变得非常重要且非常紧迫。美国管理咨询公司麦肯锡全球研究院(MGI)预测,如果美国的医疗行业能够有效利用不断增长的大数据来提高效率和质量,那么每年可创造超过3000亿美元的额外价值,可以挽救无数本可不应该失去的生命。

我们应该如何利用现代科技和互联网技术避免下一场H1N1的发生呢?大数据可以做到吗?

首先发现:在基于海量使用用户搜索、社交app、LBS等产生的大数据,还有用户人口统计学等数据,结合原有疾病监控系统中的流行疾病法定报告数据、流行疾病病例,结合疾病、环境数据,及时发现并绘制出流行病风险地图。比如,国内H1N1最早发现于广东地区,当这个地区搜索发热等关键词超过一定数量时,结合医院和疾控中心的流行病监控等数据,就能很快发现并定位新的流行病的发生及相关情况评估。

确定:在基于搜索数据和LBS数据(如百度迁徙),分析不同时空尺度人口流动性、移动模式和参数进一步结合病原学、人口统计学、地理、气象和人群移动迁徙、地域之间等因素和信息,建立流行病时空传播模型,确定流感等流行病在各流行区域间传播的时空路线和规律,得到更加准确的态势评估、预测。同时机器学习(machine learning)和人工智能等技术的发展,促进了流行病监测、传播动力学研究和风险评估,并成为传统分析方式的有效增强和升级,更加准确的判断下一场流行病的发生区域等信息。

预警及应对:结合LBS、社交app相关信息,从更加微观尺度上更加精准的进行流行病监测和预测,同时通过权威途径及时告知流行病的发展状况和预防措施,让用户了解周边流行病活动真实情况,为生活提供可信参考,避免传谣信谣,以便及时采取疫苗接种等预防措施。公共卫生、医疗机构、卫生行政部门人员将更容易获取各类疾病发生风险的动态分析结果,促进医疗人员、疫苗等资源优化和配置,有力的阻击病毒和事态的进一步恶化和扩撒,成功的避免下一次大规模的流行病的发生。

著名的《大数据时代》(维克托·迈尔-舍恩伯格、肯尼思·库克耶著)里就记载了谷歌怎么用大数据来预测病毒爆发的:2009年爆发了新的流感病毒,如果按照原有处理流程是这样的:医生发现病例——报告疾控中心——公共卫生专家分析信息——采取应对措施,但是在这个流程中会存在信息和数据滞后,这种滞后导致公共卫生机构在疫情爆发的关键时期反而无所适从。谷歌通过建立在大数据的基础上完美的解决了这个问题,它通过观察人们在网上的搜索记录来完成这个预测,它保存了多年来所有的搜索记录,而且每天都会收到来自全球超过30亿条的搜索指令,如此庞大的数据资源足以支撑和帮助它完成这项工作。通过对海量数据进行分析,获得以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。这就是大数据的力量和魅力。

联想在不久前的百度技术开放日上特别介绍了百度大脑及大数据引擎。可见大数据战略已成为百度未来研究的重要方向。百度自身在大数据领域的发展已领跑业界,加之不久前才加入百度的天才级人工智能专家吴恩达,几乎可以肯定,百度将不断通过搜索的长期数据积累和人工智能领域的技术创新,带动一场商业、医疗、生活等各个领域前所未有的大变革。

相信随着大数据和慢数据挖掘、人工智能技术的发展,成功预测并避免下一次H1N1不再是梦想!

南七道:前创新工场项目负责人,移动互联网创业者,提供微信APP等移动互联网系统解决方案,微信公众号:南七道或nanqidao
本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定