登陆注册
24612700000024

第24章 更自由,更开放,大数据的机遇和挑战(2)

智能手机和计算机技术的推广,使得个人生活行为的数据化已经变得极为容易。很多创业公司为了研究睡眠模式测量了人们夜间的脑电波,例如Zeo公司就已经有了全球最大的睡眠活动数据库,用于解释男性和女性睡眠时眼睛快速动量的区别。还有Asthmapolis公司把感应器绑在了哮喘病人的呼吸器上,然后用GPS定位的方式来收集位置数据,再来推断病因中的环境因素。Fitbit和Jawbone公司则是对人们体力活动和睡眠进行测量。Basis公司利用腕带来检测人们的生命体征,像是心率和皮肤电传导率等等,这些都可以用来推断他们所承受的压力。2009年,苹果公司有了一项专利,也就是对血液氧合、心率和体温的数据采用音频耳塞的方式来收集。这个时代数据的收集似乎已经比任何时候都简单且不受约束了。

人们似乎从数据化那里得到了更多人体运作的方式信息。挪威耶维克大学的研究人员和Derawi Biometrics公司联合开发了一款可以用在智能手机上的应用程序,它主要的功能在于分析人走路时的步伐,并将其作为手机解锁的方式。与此同时佐治亚理工学院的罗伯特·德拉诺(Robert Delano)和布莱恩·派尔思(Brian Parise)也开发了一款名为iTrem的应用程序,主要可以用来监测人体的颤动情况,为帕金森症和其他神经疾病的病人服务。医生和病人都受益于这些应用程序,病人不需要再到医院去做昂贵的体检,医学家们更是可以远程检测病人的疾病情况和治疗情况。东京的调查人员提到,尽管智能手机上的这些应用程序和三轴测振仪相比还不那么精确,但是一般使用是没有问题的。这也再一次说明,完全精确并非总比不精确有效。

大多数的时候,信息会被采集存储后再来使用,任何领域,任何事情都可以用这样的方法处理。Green Goose是一家创业公司,它们主要销售的是放在物品之上的微型运动感应器,以检测物品的使用次数。像是放在一捆牙线、一个洒水壶或是一盒猫食上,就能读出牙齿情结、植物护理和宠物喂养的所有信息。人们常常对“物联网”非常狂热,想在生活中的所有事物身上植入芯片、传感器和通信模块。好像这个词和“互联网”非常相近,但实际上它表示的是一种典型的数据化手段。

当下假设有一个重大的基础设施项目正在进行,很大程度上这和过去所做的一切都不一样,不管是罗马的水渠还是启蒙运动中的百科全书。它是全新的,但是又让人们置身其中,又好像是无形的,但和水渠中能触摸到的水不一样,因此人们总是无法意识到它的存在。所谓的它就是无处不在的数据化进程,它能够带来和其他基础设施一样的社会大变革。

城市的发展因为有了水渠而成为可能,启蒙运动因为有印刷机而得到推动,国家的兴起因为有了报纸而奠定了重要基础。所有流动的譬如水,譬如知识基础设施所依赖的。包括电话和互联网也不例外。相比而言,数据化所带来的转变则是革命性的。在大数据的帮助之下,世界在人们的眼里不再是一连串自然或是社会的现象了,而是由信息本质构成的。

一个多世纪以来,物理学家对人们宣称世界的本源不是原子而是信息。当然这个理论听起来有点让人难以置信。但是在数据化的推动下,人们能够全面采集和计算有形和无形事物的存在,并对其进行处理。

世界被视为是信息,可以将其视为是数据的海洋,它为人们提供了一个前所未有的看待这个世界的角度,可以充分地渗透到生活各个领域的世界观。

早晚会有一天,水渠和报纸的影响会由于数据化而渐渐消退,与此同时,再为人类创造一个数据化时代下的产物。因此它对传统印刷术和互联网也产生了冲击。只不过目前它还只是在商业领域上被应用。

数据化带来的挑战前所未有

大数据的核心在于带来了分析信息的三大转变,它导致了人们理解和组建社会方法的改变。

第一个转变就是大数据时代的到来,让人们可以更多地分析数据,不再依赖于随机采样,而是分析和某现象相关的所有数据。19世纪以来,当有大量数据出现时,人们的处理方法往往都是采样,这种方法是在缺乏信息和信息流通受到限制的模拟数据条件下产生的。通常很多人会觉得这是理所当然的,可是当高性能的数字技术开始流行的时候,人们才明白这是人为的限制。和小数据范围相比,大数据的分析能够带来更高的精确性,而从中还能挖掘出不少此前无法发现的细节问题。所以说,人们利用大数据看到了更多样本本身无法揭示出来的细节信息。

第二个改变在于,大数据的研究和分析,让人们对于精确度的追求不再那么热衷。在测量事物能力受限的情况下,人们最为关注的事情莫过于精确的结果。要是购买者不知道牛群里的牛是80头还是100头的话,那显然交易就很难进行了。一直到今天,人们还是习惯于在精确的基础上建立数字技术。例如只要电子数据表格能把数据排好,那么数据库的引擎就可以帮助人们检索出内容完全一致的检索记录了。

在“小数据量”的情况下,这种思维方式是可行的,毕竟供分析的数据还不多,那人们就需要尽可能地去精准分析和量化每一项记录。人们已经在某些方面意识到差别的存在了,比如晚上打烊时的小商店总是细细地把每分钱都数清楚,可是没有人会一分钱一分钱地去衡量GDP。随着数据规模的扩大,人们就不再会那么痴迷于精确度了。

专业的数据库是达到精确的基本保障。针对小数据和特定的某件事情,人们能够去追求精确度,像是某一个人想要确认自己的账户上是不是有足够的余额去开支票。可是大数据时代到来的时候,精确度的追求已经不可行,甚至不受到欢迎了。一旦有了海量的数据,人们所追求的目标就不再是精确度了。

复杂多样的大数据,在全球多个服务器上分布。人们在拥有大数据的情况下不用再纠结于一个特定的现象,只要是大方向掌握了就可以了。当然这不代表精确度就不需要了,只不过是不希望人们只是执着于此。微观层面上的精确度适当放弃一些,会让宏观层面上的我们有更好的洞察力。

前两个转变促成了第三个转变,那就是因果关系不再是人们热衷去寻找的了。人类长时间都习惯于寻找因果关系。即便是没有太多用途的因果关系,人们还是会习惯性地去找到这关系。可是到了大数据时代,因果关系的重要性渐渐被忽略了,取而代之的是事物之间的相互关系,这显然是一个相当新颖且有价值的观点。相关关系或许有可能无法告知人们事物发生的原因是什么,但是能提醒大家有事情正在发生。很多情况下,这种提醒就足够了。

或许数以百万计的电子医疗记录说明特定的组合橙汁和阿司匹林对治疗癌症有作用,可是这种治疗方法显然要比找出具体的药理机制重要得多。相同的,我们只需要知道买机票的最佳时机是什么时候,完全没必要去理解价格疯狂变动的原因是什么。大数据能告诉我们“是什么”而不是“为什么”。现象背后的原因是什么不需要人们去理解,只要数据能够自我发声即可。

没必要用少量的假设来进行分析,如果海量收据还没有收集全的话。只要是数据能自我发声,那很多从前尚未为人们所意识到的联系就会被人们所认识的。

就好比对冲基金在分析了社交网站Twitter上的数据信息后推测了股市的表现,亚马逊和奈飞(Netflix)也在自己的网站上依据用户的类似查询来推荐商品,还有Twitter,Facebook和LinkedIn则是利用用户的社交网络来了解用户的喜好等等。

几千年前,人类就开始了数据分析。最初美索不达米亚平原上的记账人员发明了书写,只为有效跟踪记录信息。圣经时代开启后,为了人口普查,政府开始建立大型的国民数据库。两百多年来,精算师们也在大量收集数据,只为了规避风险。

在模拟数据时代,收集和分析数据是一件很困难的事情,一旦有新问题出现,数据分析就不得不重新开始。来到数据化的时代,数据管理效率已经有了大踏步的进步了。数据化的进程将原本模拟数据转化为了计算机可读的数据,存储和处理这些数据就不再那样困难了,数据管理的效率也逐步提高。曾经要几年才能完成的数据收集和分析,现在只消几天的工夫。不过改变不是唯一的。曾经人们有一种偏见,认为数据库仅有单一的用途和价值,那是模拟数据时代的技术和方法所导致的。大数据转变尽管是数字化促成的,但这绝不仅仅是计算机存在所能实现的。

现在正在发生的一切人们已经无法准确描述了,但“数据化”的概念足以让人们去了解这次变革。它意味着所有人都要从世间万物中汲取信息,包括那些曾经认定和“信息”完全没有关系的事情。例如人们所处的位置、引擎的震动、桥梁的承重等等。量化的方式能够让这些信息都化为数据,这也使得从前无法做到的事情如今都成了可能,例如引擎会不会出现故障可以从引擎的散热和震动来推测。这样一来,数据就能够挖掘出前所未有的潜在价值了。

大数据时代为人类提供了一场寻宝游戏,数据让人们将关注点从因果关系转为相关关系,并释放出了潜在的价值,这就是主宰这场游戏的关键。这一切成为可能都源于新兴技术工具的使用。宝藏中不止一件宝贝,数据集内部都有着不为人知的价值。这些数据价值的挖掘和利用的竞赛正在全球各地上演。

数据处理技术已不是新鲜的事物,但最初它只是调查局、研究所和世界上的巨头公司掌握的一项技术。像沃尔玛和美国第一资本银行就领先其他企业在零售业和银行业率先使用大数据,这两个行业因此而得到改变。现在这些技术已经普及到各个行业。

个人受到大数据的影响是最大的。专业性在一个可能性和相关性占主导的世界里已经不再重要了。不过这并不说明行业专家会消失,因为他们要和数据表达进行博弈,就像是《点球成金》电影里的那样,统计学家让棒球球探们感到惭愧不已,精准的数据分析让直觉的判断不得不退居二线。人们因此不得不去调整管理、决策、人力资源和教育方面的传统理念。

大部分时候,人们都会将习惯建立在一个预设好的立场上,但是这只适用于少量、精确且重要的决策信息时代。一旦数据量规模变大,处理速度增快且数据不再那样精确,所谓的预设立场就不存在了。数据量庞大的情况下,人类自身就要让步于机器来做出决策。当然,不得不承认这也存在一定的弊端。

社会在监视和了解人类的行为上已然有了数千年的历史了。可是一个算法系统要如何监测呢?信息化时代的最早期,政策专家已经发现了人类的隐私权遭受到了信息化的威胁,人们不得不建立起一个庞大的规则体系来维护个人的信息安全。大数据时代来临的时候,这些规则又都失去了原有的作用。对于信息分享人们很热衷也都是自愿的,网络服务当中的一个中心特征就是信息分享,而不再是规避的薄弱点了。

对人们来说,似乎隐私的泄露已经不是危险,而转换成了被预知的可能,它们能够预测人们是否拖欠还款或是犯罪,这些算法很显然会让人们在尚未做出这些行为之前就预先被逮捕。因此大数据是统计的首位,那即便是这样,个人意志是不是就高于大数据呢?就仿佛出版印刷行业的发展推动了一个国家言论自由的立法保护,而大数据时代也必须推动个人权利捍卫的立法保护才行。

在处理和控制数据的方法上,政府机构和社会都要有全方面的改变。这是一个难以否认的用数据来预测一切的年代,尽管背后的原因究竟是什么我们难以解释。医生若是要求病人遵从医嘱,但对于医学干预的合理性无法说明的话,那将是什么情况呢?事实上在大数据时代,这是懂得病理分析的医生一定会去做的事情。此外司法系统的“合理证据”要不要改成“可能证据”呢?若可以这样做的话,那么人类的自由和尊严会不会也因此受影响呢?

大数据时代也必须有一系列倡导的规范制度,它们和曾经小数据时代发展并留存下来的规范有着继承的关系,只不过在新环境下旧规范也要与时俱进了。

人类在寻求量化方式认识世界的道路上大跨步迈进的标志就是大数据的出现。从前很多东西无法计量、存储、分析和共享,如今都被数据化了。世界因为大数据和海量的不如从前精确的数据为人们开启了一扇全新的理解世界的大门。社会对于因果关系不再执着,反而去关注相关关系的好处。

现代社会有了寻找原因这一神论,但因大数据的出现而被推翻。只不过人们又陷入了另一个历史困境中,那便是这是一个“上帝已死”的时代。换句话说,传统固守的信念已经开始发生动摇了。更让人感觉到讽刺的是,信念正在为“更好”的证据所取代。经验中获得的信息、直觉和迷惘都和证据相矛盾,它们是什么样的角色呢?世界转而开始挖掘相关信息,人们又该如何在不破坏传统因果推理的基础上来保证社会繁荣、人类前进并取得实质性的进步呢?

同类推荐
  • 我看电商

    我看电商

    本书是作者近30年从事零售及电子商务管理的总结和分享。近年来电商行业在中国迅猛发展,2012年网络零售市场规模达到13,000亿人民币,诞生了淘宝、天猫、京东、当当、凡客、唯品会……等一大批全新的网络公司,电子商务正在日益深入的影响着越来越多人的生活。如今这位自称跨界老兵的电商操盘手第一次全方位剖析电商风云,细说中美电子商务发展的不同路径,评点国内各大电商企业的是是非非,详解其中的融资、模式、运营、效率……个中经验,毫无保留的娓娓道来,笔触至深,让人不禁掩卷沉思。
  • 纵横于天地之间——互联网络技术

    纵横于天地之间——互联网络技术

    本书告诉你:不管你是谁,只要生活在当前的时代,你一定知道电话,知道电脑,知道上网……知道许许多多关于电子、关于计算机、关于网络的话题,这就是网络时代。网络的话题可多了:它是怎么来的?什么是“蜘蛛网”?网络的过去和现在,上网的方法,如何使用网络,互联网的安全,网络有“陷阱”吗?网络有“瘾”吗?网络文化和未来又是怎样的?到书中去找答案吧!
  • 黑客就在你身边

    黑客就在你身边

    互联网络正在改变着我们的生活,每个人都处在互联网的天罗地网之中。本书以轻松的笔调,向人们介绍了有关“黑客”的知识。当你读完这本书后,你会发觉“黑客”一点都不神秘,他们渴望全社会对他们有一个公正的评价。
  • 组建家庭局域网与无线网

    组建家庭局域网与无线网

    该书是“快乐驿站”丛书之一,是一本精心为初级家庭电脑用户打造的局域网与无线网组建入门与提高的图书,同时还涉及一些办公网络的组建内容。《组建家庭局域网与无线网》以局域网和无线网的功能、设置以及实际应用为导向,用生动的实例、形象的图解和幽默的语言循序渐进地介绍了局域网和无线网的概念、产品、设计、组建、调试与维护的相关内容。
  • Delphi程序设计教程

    Delphi程序设计教程

    本书为适应不同层次读者的需要,从Delphi的基本知识讲起,由浅入深,全面讲述了Delphi的集成开发环境、Delphi的编程语言——ObjectPascal、常用组件的使用、窗体的设计、菜单的设计、对话框的设计、多文档界面程序的设计、多媒体编程和数据库应用程序设计等内容。
热门推荐
  • 安全教育读本

    安全教育读本

    本书针对职业院校学生特点及特殊性,从学校学习安全、生活安全、网络安全、心理安全、校外实习安全、公共安全、社会生活安全等方面,通过案例以案说法,深入浅出,突出重点。通过案例警报让人触目惊心;安全警示提炼要点,剖析原因;伤害预防给您支招;应急救援教你方法;法律链接寻找依据;安全小贴士拓展知识面;自我检测强化记忆;应急模拟或自护训练发人深省,引人思考。
  • 混元掌控者

    混元掌控者

    他曾是家族的荣耀,但却从极品天才沦为极品废材,成了家族最大的耻辱。遭受到家族的杀害死,命运让他死而复生,经历了奇遇,他找到了混元道碑,得到了玄士们梦灭以求的混元天道.体内的特殊血脉也已经觉醒,让他拥有踏上强者之路的资格,在寻找一块块道碑的过程中,他在变强,眼前的一切迷雾他将用手中的剑去破开,他坚信总有一天众神也将匍匐在他的脚下颤抖。
  • 墨爷的小东西

    墨爷的小东西

    “朕错了,你能不能不要离开朕,你回来以后你做什么我都不逼你了”一个穿着明黄色龙袍的男子跪坐在床边怀里抱着一个女子。“皇上,柔妃娘娘醒了”一个太监进来,看着皇帝的女子微微一惊。——————————————现代“兮儿,我错了,原谅我好不好,回家我马上就跪搓衣板”在大马路上一男子拉着一女子的衣袖
  • 我是最强欧皇

    我是最强欧皇

    欧佑非带着幸运异能穿越到平行世界的自己身上。这个世界异空间降临。无数异兽源源不断的涌入,杀死它们可以从概率提取出本源,吸收后不仅可以提升属性,甚至可以得到它们的能力。别人狩猎一天得不到一个本源,作为欧皇,欧佑非杀一只就能把它的能力爆个干净。————这是一个天选之人疯狂秀操作的故事。
  • 海报里的女人

    海报里的女人

    黎小雅在不眠酒吧离奇死亡这件事在M市闹得纷纷扬扬。错综复杂的人际交往,让案件真相的揭露雪上加霜。关于黎小雅的离奇死亡只能通过与其相关的人进行侦探。你能猜到是谁吗?
  • 霸道男神强娶呆萌影后

    霸道男神强娶呆萌影后

    “喂,大叔,做人要懂礼貌,你难道不知道爱幼吗?你这样是不对的呦!”她说。她与他一次偶然的邂逅,使她成为了世界著名的影后,受到了世界人民的喜爱,同时,她也受到了许多磨难,而他.........
  • 秦少注意,豪门千金回来了

    秦少注意,豪门千金回来了

    上辈子纪泠珏在豪门纪家活的战战兢兢也落不得一生好,重生后的她决定为自己、为家人也要在这豪门撕出一席之位。本以为如前世被人拿婚约做工具,却没想到一直以来自己当作长辈的男人装模作样,将她引入围局。“于我,于你,都是最好的合作。”“好,成交。”人人称道新贵秦非池以前拈花惹草、和明星网红名流的绯闻层出不穷,婚后一朝从良,甘心做纪冷珏池子里的鱼。为了达成目的,所临时拼凑的爱情,展开的新生活如同冰糖炖雪梨........--情节虚构,请勿模仿
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • Burlesques

    Burlesques

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 重生男神:小哥哥别太冷!

    重生男神:小哥哥别太冷!

    近期江城有一条传闻,被豪门苏家放弃的苏二少,逆袭了?被困九万年的第一上神苏乱归来,问鼎天下,谁与争锋?苏乱这一生最后悔的事。抱大腿抱上了宫战权。一见倒霉!二见倒霉!三见倒霉!!!宫战权这一生最幸福的事。扑上来的苏乱。一见钟情,二见倾心,三见抱回家!“苏乱,你不过是一个没人要的可怜虫,有什么狂的?”一群渣渣叫嚣道。少年清冷眸子升起惊涛骇浪。下一秒,她落入了一个温暖的怀抱。“谁说苏乱没人要,这辈子她是我的,下辈子我预定了,下下辈子,生生世世,都是我一人的。”