《数据之巅》书评

出版日期:2014-5-1
ISBN:9787508644662
作者:涂子沛
页数:368页

也谈大国不能不识数

第二季第18期《罗辑思维》节目播出了,讲的是涂子沛老师的新书《数据之巅——大数据革命,历史、现实与未来》。像罗胖一样,我花了两天的时间一口气、不间断地读完了这本书,最深的感觉就是两个字“震撼”!第一个感受:辩论是个技术活。辩论不是吵架。吵架,吵的是情,不是理。吵架的过程本身就是它的目的,是为了宣泄情感,不是为了争论出个结果来。因此,有人说小两口吵架,记住“女朋友永远是对的”这句话是不会吃亏的。辩论则不一样。《数据之巅》这本书中,原汁原味地介绍了美国历史上的很多精彩辩论。从选议员,到打仗,再到修水利,甚至是打官司,几方力量基于数据反复博弈,过程之惊心动魄,简直令人拍案叫绝!看下来最大的感受,就是辩论如果要达成结果,就一定不能鸡同鸭讲,不能你指责我这个、我抨击你那个;双方一定要在同一个层面、同一个问题上对话,这样才能形成交锋,才能一比高下。我在准备文案的过程中,看到一篇文章说,中国人之所以没有辩论的传统,诸多原因之中有一条,就是中国方言太多,你讲的,我听不懂,我讲的,你不明白,辩不起来,辩论也未能在社会上蔚然成风。先不说这个说法对不对,但至少它给了我们一个启发:数据是双方使用同一种语言,是辩论的武器,是对话的基础。基于数据的对话,是理性的、能得出结论的,也是有助于问题解决的。数据能推动共识,也会激发关于量化标准和方法更加激烈的辩论。但是不管这个辩论再怎么激烈,它都是在用同样的方法讨论同一个问题,这说明双方是有共识基础的,并且这个基础将随着讨论的深入不断增加。最怕的是什么呢?是基于道德的对话。《魏忠贤:道德下的蛋》这期节目,讲的就是用道德是非作为判断标准,会出大问题。因为道德,是用我的这套标准来绑架你,虽然是在论是非,最后却没有了是非。再拿吵架做例子。比如,老王对你说:“你讲的不对。”对不对,你还能解释。但如果老王上来就作道德判断,说:“你是个坏人!”你在他心里是不是个坏人,无论怎么说,都说不清楚了。“共识”是当今中国最常讨论的一个话题。我们讲利益多元化也好,讲要找“最大公约数”也好,都是一个意思,要在国家政策制定和资源分配等问题上,尽可能消除分歧、达成全社会的共识。学会怎么辩论,怎么运用数据来辩论,应当是我们作为大国公民必须经历的一个过程。第二个感受:数据文化是尊重事实、强调精确、推崇理性和逻辑的文化。这是涂子沛先生写在《数据之巅》扉页上的一段话,后面一句是:“数据文化的匮乏,是中国之所以落后的一个重要原因,建设这种文化,中华文明的面貌将焕然一新。”这句话是非常发人深思的。为什么说数据就是尊重事实?因为数据就是证据,基于数据的辩论就是拿出“我是对的、你是错的”的证据,基于核算的成本收益法就是拿出“为什么这样决策”的证据。有时候,你看到数据扭曲了,比如美国宪法规定,黑人按3/5个白人来纳税、选议员,之所以这个数这样荒唐,是因为这个社会扭曲了,数据只是社会客观现实的忠实反映而已。为什么要强调精确?因为中国人太缺乏这个观念了。胡适在《差不多先生传》中给中国人画了一个像,凡事只讲“好像”、“大概”、“也许”,做事不守时,思想不缜密,态度总是马马虎虎。当然,经历过现代化的洗礼,中国人身上的这些毛病好了一些,但也还是存在的。我们不妨扪心自问,中国的会议有多少能按通知时间准时开始?我们每个人在工作中所管辖的人、财、物的数量,自己是否说得清楚?谁都说不清楚,就说明是有问题的。最后,为什么要尊重逻辑呢?逻辑其实就是一种思考能力,一种能够代替道德、明辨是非的能力。讲逻辑,就是讲道理。而在所有的逻辑表述形式中,数据是最清晰、最简单、最直接的,因此,数据文化必然也是一种尊重逻辑的文化。第三个感想:数据能够建立反馈回路,不断推动产品、制度、社会的进步。威廉·罗森在《世界上最强大的创意》一书里讲到,利用蒸汽动力需要诸多方面的革新,其中最重要的包括测量蒸汽机能量输出的新手段以及一种能够测量细微长度、被称之为“大法官”的测微计。这些测量工具可以让发明者知道他们的增量设计变更是否能够带来性能的改进──比如更高的功率和更低的耗煤量──这都是制造更先进的蒸汽机所需要的。按罗森的话来说,如果没有精密测量结果的反馈,发明“注定是寥寥无几、飘忽不定的”。有了它,发明变得“司空见惯”了。这个例子是我在比尔·盖茨2013年度公开信《挥舞量化的魔棒》中看到的。盖茨有段名言:”任何事情:如果你不能量化它,你就不能真正理解它;如果你不能真正理解它,你就不能真正的控制它;如果你不能真正控制它,你就不能真正的改变它。“这段话讲的就是数据是一种进步的力量。在《数据之巅》这本书中,基于数据的进步的例子比比皆是。其中最令人惊骇的一个例子,是人口普查数据怎样成为国家权力和资源分配的基础,围绕人口普查的争论越来越多,普查工作量越来越庞大,后来又催生了打孔机的诞生,产生了IBM等一批公司,最后引领美国步入了信息社会。此外,国会议席分配方案一轮又一轮的改进,水利工程收益计算方法一次又一次的进步,都是数据推动的。我曾提议《罗辑思维》这期节目的标题可以叫“数据进化论”,提议虽然没有被采纳,但是罗老师也说,这个说法是“非常精准”的。

畅享大数据时代的智慧生活

畅享大数据时代的智慧生活——涂子沛《数据之巅》读后彭忠富人类知识的唯一来源,是对过去经验的记录和整理,而数据,正是这种记录的载体。因此数据的价值首先在于它是知识的来源。如果说传统的数据是人类部分知识的来源,那随着人类记录范围的不断扩大,现代意义上的大数据将逐渐成为人类全部知识的来源。数据,自古就有,人口普查、农业统计、军事战争……数据虽小,却有助于治国安邦。美国开国不过200多年,但数据在其国家生活中的历史,却几乎和其建国史相生相伴,准确地说是和其宪法的制定同步。美国的建国者把人口普查写进了宪法。他们认为,国家权力应该在人口之间平均分配,这个平均,必须用数据来说话。人口普查的数据,最后成了美国国家权力、资金、资源最根本、最公平的分配标准和依据。数据文化,是尊重事实,强调精确,推崇理性和逻辑的文化。美国之所以繁荣鼎盛,数据文化根基牢不可破大概是主因之一。在知名信息管理专家,专栏作家涂子沛的新著《数据之巅:大数据革命,历史、现实与未来》中,作者以数据文化为切入点,深刻剖析了美国近两百年来繁荣昌盛的历史,给中国指明了深化改革的途径,让人耳目一新。在这本书中,从小数据的历史到大数据的崛起,作者以宏大的历史观、文化观、大数据观,给我们描绘了一幅数据文化、智慧文化的全景图。全书从美国建国之基讲起,通过描述初数时代、内战时代、镀金时代、量化时代、抽样时代、开放时代、大数据时代的特征,系统梳理了美国数据文化的形成,阐述了其数据治国之道,论述了中国数据文化的薄弱之处,展望了未来数据世界的远景。阅读此书,历史与现实相互融合,知识与激情相互交织,思想与观念相互碰撞,未来与前景必定豁然开朗。人类已经跃进到大数据时代,数据不仅是新知识的来源,还是记录历史最重要、最可靠、最好的方式。大数据之大,不仅在于其大容量,更在于其大价值。价值在于使用,通过特定的算法对大量的数据进行自动分析,从而揭示数据当中隐藏的规律和趋势,为决策者提供参考。作者建议,各级政府应该发挥主导作用,首先在公共领域推行数据治国的理念。政府用好数据,开放数据,可以服务于经济发展,推动社会创新。政府要认识到,在大数据时代,公共决策最重要的依据是系统的数据,而不是个人经验和长官意志。政府应加大数据治国的舆论宣传,将数据的知识纳入公务员的常规培训体系,力争在全社会形成“用数据会说话,用数据管理,用数据决策,用数据创新”的文化氛围和时代特点。“尊重事实,用数据说话”,“推崇知识和理性,用数据创新”,作者试图把数据这个科技符号在中国转变为文化符号,形成一种文化与体系,使数据文化进入中国人的视野,融入中国人的意识与血液。大数据中蕴含着大能量,大能量带来大发展,大数据正在撬动中国的制度创新、科技创新,让我们一起努力,畅享大数据时代的智慧生活吧!

不只是数据

在“罗辑思维”的视频里,听到推荐,稍微犹豫了一下,便决定买来看。稍微犹豫是因为,曾经匆忙地读过涂子沛先生的前一本《大数据》。个人感觉新观点并不多,内容偏重记叙大数据在美国的运用。但作者很好地选取了事件,加上一些点睛的评论,让我对美国的社会、政治制度有了一个全新的认识。但也是冲着这一点,我决定买来看的。罗胖子说,这本书说的哪是历史,是一种思维方式。我部分认可。首先,这本身就是一本按美国的历史来叙述的书。作者把美国的历史划分为7个时代,分别描述各个时代数据的源起、存在与作用。其次,美国人对待数据的态度也是一步步发展出来的,这里跳脱不了历史在这其中的作用。放在别的国度,很难会有这样的结果。最后,这也是作者的硬伤。全书记叙为主,对大数据的未来,或是未来大数据会有怎样的进化并没有更创新,更大胆,更有建设化的设想。书中最后对“智能化城市”设想也止步在现有的设想与规划里。读此书一定会有意外的收获--与国内惯常教育给我们的思维很大不同的思维与方式。例如,书中记叙富兰克林在美国立宪会议最后一天的讲话。“对这部宪法中的一些条款,我并不完全赞同,但我不能肯定我会永远不赞同,因为许多我过去认为是正确的观点后来都发现是错误的。” “每一个来开会的人,固然带来了他的智慧,但同时也带来了他的偏见、错误、地方利益和个人私利。因此,无论召开多少次会议,也未必能制定出一部更好的宪法。”这与我们惯常的“意见统一”的提法完全不同,真正诠释了“求同存异”。让我深为感动。再例如,美国最高法院判决蒙大拿州的席位诉讼:在对绝对公平进行了足够的善意尝试之后,如果仍确定不了哪种方法最好,而且出现了无法避免的缺陷,我们最后必须尊重国会的决定。这也是我们今天能学习到理性与人性的结合。这本书,内容不算少,但涂先生的笔风还是处处充满幽默,读起来很是轻松,就好像他本人坐你面前,和你侃侃而谈。我基本上是读起来就不想放下。例如描述描述美国人分配众议院席位的故事,着实让我笑出声来。很是欢乐。本书最震动我的部分,不是日本人请戴明博士去帮他们改造日本的企业,也不是对韩国人认真学习的描述,而是美国人在发现自己被日本人超越了以后,他们的所做所为,以及,戴明博士的为人为学的风范。美国人的确自信、自大,但也爱承认错误。当发现自己真得落后了,真得没把日本人重视的理论与方法当宝后,人家还是认真的重新请出戴明,从头学起,迎头赶上。没有废话,没抱怨,重来就是了。而戴明博士作为一位物理学家,居然能在半个多世纪前就跨界到管理范畴,这不可谓学术与教育的幸事。而他甘于在美国管理学术界默默无闻,但没有停止自己的研究;但日本人找他出山时,他又能为知音倾囊相授;回来美国,没人理解也没人理睬,依然如故;直至被美国人重新认识,老先生80多岁依然四处教学,并没有因为当年的冷落而心有芥蒂。如此风范,当是吾国人学习的典范。

用大数据对抗“粉色浆糊”

我对定量分析的方法向来持有戒心,认为数字可以被人“按摩”,抚平成为别人所需要的模样。可是有一天,家里小孩的一个新说法,让我的成见有所松动。我想带他们去快餐店吃饭,过去他们很喜欢,但不知学校营养课做了什么宣传,他们这次不愿去了,说有些快餐店用的牛肉饼,可能是“粉色浆糊”(pink goo)。 所谓粉色浆糊,是指将牛肉,牛杂碎甚至其他一些不卫生的东西一起搅了。你以为你吃的是牛肉,谁知道里面是什么东西?人的观念何尝不是这样?好多被我们接受的结论,你可能以为是事实,但里头掺杂了多少私利,偏见,还有舆论影响?天知道。解决思维的“粉色浆糊”,应多倚重数据。《大数据》作者涂子沛先生最近又出了一本新著《数据之巅》(中信出版社,2014版)。他的上一本书,在国内产生的社会影响近年少有。上至国务院副总理汪洋,下至一些地方小企业的老板,阅读《大数据》、谈论大数据,已蔚然成风。在他著作的推动下,佛山南海区甚至设立了大数据局,我相信类似机构也会陆续在其他地方设立。这是好事,也是海外学人给中国带来的一种改革新风。但愿行政各级对大数据的重视不是雨过地皮湿的形式主义,而是能产生些实质影响。中国行政中“拍脑袋决策”一向为人诟病。科学决策这几个字写起来易,做起来难。没有人,哪怕是腐败官员,愿意去担“拍脑袋决策”的恶名,一个重要原因就是过去缺乏方法,包括如何采集数据,如何使用数据。《数据之巅》这本新书比《大数据》脉络更为清晰。纵线为美国历史,包括美国第一个百年的三个时代:初数时代、内战时代、镀金时代,以及20世纪后数据成熟期的量化时代、抽样时代、开放时代、大数据时代。除了写大数据的成长,让人认识大数据之外,也让人从一个新鲜视角,认识美国政体的设立、演变、成熟的过程,如科学决策方法的出现、机构的设置等等。比如,在“初数时代”,书中写道了参众两院的结构设置,人口统计中黑人计数方法等。以数据写史,使得书比“民主的细节”还细节。美国人有时候会说,“大象也要一口一口吃”。大的概念,有时候无从入手。对于比较成熟的美国社会制度,国人羡慕的很多,但是如何借鉴,则有无从下手的苦恼。数据是一个非常好的切入口。数据也是一个中立的工具,能在改进中国社会的同时,避开意识形态的顾忌和干扰。作者用数据梳理了美国的历史,他让我们看到,美国走过的路,有一些我们正在走,或者将要走。比如美国的“镀金时代”,工业化提速,城市化加快,和中国现实不无类似,此间统计与数据所促成的革新,对我们就有直接的指导意义。作者不仅仅是审视了美国的发展,还布了一条横线,由外而内,增加了对于中国大数据发展的关注。这种关联有问题上的类比,比如福特公司的人命换算,对中国交通事故管理的一些启发。也有一些关联,产生的是一种急迫的呼吁。书中最为精彩的一部分,说的是美国人戴明,如何使用基于统计数据的质量管理思维,影响了日本的工业制造,使得日本产品给人的印象,从劣质产品快速转化为质量一流的产品。作者呼吁中国也引入这种统计思维和数据文化,改进“中国制造”的质量,继而提升在国际竞争中的地位。能不能形成这种数据文化,有官方的推动自然是好事。而在民间,数据革命也在悄然开展。计算机、手机、可穿戴技术的日渐普及,使得普通人也开始自觉不自觉地接触、产生数据。大数据的土壤正在形成。虽然有隐私问题需要持续关注,数据的采集越广泛,也就越可靠,越有用。精明的商家早已明白这个道理,在数据发掘上已抢先一步,如书中介绍的神州数码和中信银行。涂先生也认为,在教育等很多其他领域,数据也有巨大的潜力。比如在教育领域,人们也越来越重视实证研究中数据所支持或者否定的结论。现在一个很流行的说法,是“基于证据”(evidence-based)。 教育者说基于证据的学习策略(evidence-based learning),医生们说基于证据的医治(evidence-based medicine). 这种“证据”来自哪里?最主要的渠道就是数据,作者给我们交代了信息、数据、知识层层递进的证据。大数据也可以变做“小数据”,亦即人们实际生活中可用的数据,我们跑步时所戴的跑步手环,可帮我们采集锻炼的数据,我们还可下载相关手机程序,控制自己的饮食。我们正在成为“量化的自我”(quantified self). 量化和数字化,也未必就是枯燥乏味的“必要邪恶”(necessary evil)。涂先生把数据大数据写得风姿绰约。大数据确实可以很迷人。为了了解莎士比亚的词汇使用,我找到了一篇文章,其作者统计了莎士比亚不同风格作品的词汇使用状况,结果发现,莎翁在悲剧中使用的词汇多于喜剧。我问我一个专门研究莎士比亚的朋友这是怎么回事?她说悲剧通常需要更为深入地再现人类深层的苦难和处境,需调用的概念更多一些。数据有时候会暗渡陈仓地把我们带到洞见面前。这几年涂先生繁忙地奔波于大洋两岸,成了“大数据”文化的布道人。同样写“大数据”的图书,目前市面上还有其他一些,如迈尔·舍恩伯格所著同名图书。不过涂在中美的政府机构都做过事,无疑更接中国的地气。也正因为中美两个国家的情况都了解,他就能在《数据之巅》中如数家珍地说到中国现当代数据的使用,比如陈正详在数据可视化方面所做的努力。舍恩伯格也不大可能会发现唐代2625个诗人的籍贯分布,宋代2377个诗人的籍贯分布等有趣数据 —— 这样的数据,启发人们从新的角度去思考文化的变迁,给文化研究提供新思维新方法。又如,涂先生还从美国南北战争期间谢尔曼将军依据数据发现最佳行军路线,说到林彪利用大数据打胜战的奥秘。此书观点权威,资料翔实,描述生动,连我一个外行人都能看得津津有味。我们都已经被大数据重重包围,《数据之巅》这样“干货”极多的书,我们必须阅读,多些了解,可以在我们各自的工作和生活中,多些数据的意识和方法,少些“粉色浆糊”。

让历史告诉未来

这本书的名字叫《数据之巅》,而读书的过程,确实让人有种俯视的感觉:不仅把数据的本质讲清楚了,更是把历史的脉络理清楚了。了解历史,对科技人员特别重要,我国的学术界很容易犯盲目跟风的毛病。究其原因,就是割裂历史的逻辑,进而拔苗助长、理论脱离实际。《数据之巅》告诉我们:大数据是从小数据发展而来的。要想用好大数据,先要理解数据本身。作为发展中国家,我们对数据的理解还是不够的,该补得课必须要补。

《数据之巅》 涂子沛著

我们通常说的大数据思维在这本书中得到了很好的解释。不得不说,涂子沛先生的这本书从独特的视角出发,看待某一历史事件的发生,给了我们全新的思维。用数据说话,寻找其中的规律,确实能够发现其中的一些微妙,至少能够带给人们一种非常客观与冷静的判断。从1787年7月4号由美国第一任总统华盛顿在费城主持的立宪会议上围绕权力的公平分配开始,可以说整个美国民主制度的发展无不充斥着各种数据的分析,甚至包括内战的兴起都和数据分析息息相关,至今为止,奥巴马的当政也已经把大数据分析上升到了国家战略的层次。这其中最有印象的莫过于1864年谢尔曼利用较为全面的数据发动的向大海进军:在没有后勤补给的情况下,6万多人行军35天、突进300多公里,取得了战争的全面胜利。在当时军备条件不那么现代化的情况下,简直是难以想象的事情,而谢尔曼确实做到了,一方面因为他有过人的谋略与勇气,另一方面也是因为他对数据的准确把握,不愧为美国历史上一代名将。后来因功被群臣拥戴提名为共和党的总统候选人,他却坚辞不就,以他特有的决绝发明声明说:“如果被提名,我不会接受;如果被选上,我不会就职”。这份说一是一,说二是二的谢尔曼声明也成了一段被后人景仰的佳话。历史上对大数据的分析,除了在政治或军事上的应用之外,在其它行业,作者也提到了一部电影《乱世佳人》的成功。盖洛普公司经过前期周密的调查与缜密的推算,估计《乱世佳人》的总观影人数在5650万,而实际观测的最终人数是5997万,两者相差不过6%,盖洛普也因为这一次的成功而一时名声大噪。此外,书中特别提到了战后日本的成功,除了日本人所谓的好学之外,其实也归因于对大数据的分析与判断,让其在一度失去了主权国家的地位上仅仅经过15年的时间就一跃发展成为全球第二大经济体,堪称浴火重生。这些成功的事例不得不引发我们深思。再后面就是现在我们即将面临的第三次工业革命,也可以说是由3D打印机引起的信息化革命,只要在材料具备的情况下,任何一样东西都可以通过众包的方式随时随地打印出来,哪怕是一件衣服、一个造型独特的茶杯,这种体验绝对会超乎我们的想象,这是任何一个时代所不能比拟的,大数据时代的到来将带来人类历史上空前的繁荣,其辉煌之势难以言喻。反观国内,给我带来大数据思维的就是阿里巴巴的成功了,记得马云曾说过:很多人还没搞清楚什么是PC互联网时,移动互联来了,当我们还没搞清楚移动互联的时候,大数据时代又来了。不得不说,我们这个时代变化太快了,稍不留心,我们已经out了。涂子沛先生是江西人,担任阿里的副总裁,一口气读完他的书,更多的是让我对数据一词有了更为深入的了解,突然发现很多事情的改进其实都可以基于数据的分析,而我们要做的就是如何以最有效率的方式去收集并整理分析这些数据,从而有效提升我们的生活。当然这只是流于个人层面,如果从更为宏观的角度去谈一个公司、或者一个城市,甚至一个国家的发展时,那么其数据之大已不是我们所能想象的了,但是,至少当我们有这样一种思维时,遇到事情就不会茫然无措,而当你站到了一定的位置,也许你提升的就不仅仅是你一个人的生活了。以上是为感。

数据详实,行文流畅,受益匪浅,是我今年读过的最棒的一本书

从来没想过这么一本学术性的书会写得这么通俗易懂,用数据说话,深入浅出,从中我了解的不只是数据应用的历史,而且获得对我今后工作的指导,发人深省,作者文笔优美,行云流水,一点也不枯躁,引人入胜,这是我今年读过的最棒的一本书!总之,这是一本兼具功能性、文学性、学术性的好书。

仅仅是数据之巅?

数据之巅本不在我的阅读计划之内,只是事情总会有偶然。作为一个沉迷于经典文学的非专业兴趣党,对这本书自然有不同的感觉。我的总体感受就是:绝不是空口说白话,对于数据的细致入微刻画让人觉得非常真实,知道它在讲什么,选举就是选举,棉花就是棉花。一本实实在在的好书。全书对我来讲,一方面,它以一种历史发展的纵轴写出了美国数据化的进程,当然涉及的方面多种多样,不论是普选,或者内战,以及后来的工业化和信息化,都有着不同类型的数据介绍。另一方面,把中国与美国的信息化数据化进行横向比较,其着眼点仍然在中国本身,正如作者最后所讲,介绍那么多美国的信息数据工程,其最终目的还是为了给国人一些启发,那就是要把中国的数据用起来作用于国民乃至人类文明,而不是放在那里如同一堆满是褶皱的废纸。我就不去讲这本书的内容了,感兴趣的人可以去看看。这本书算是我第一次接触的关于信息关于社会的书籍。首先它就打破了我长期以来的阅读格局,它突然将我的思想从经典文学时代拉到了快速的信息时代,这种冲击(暂且说做冲击)对于我而言,很大程度上让我反感。然而继续读下去,才发现,原来自己也终究还是生活在现代的人。书中对于细节的讲述,比如说选票席位的确定,人口普查时对性别年龄职业等等的关注,打孔机的发明,福特平托车油箱改造的成本收益分析,戴明在日本生产质优产品的贡献,911伤亡人数与损失的统计以及后来开发运用的 LEHD 系统,再至当今智能时代大数据的分析,每一个内容无不体现出细节,这种言之有物具体可感的内容让我很欣喜,我记得自己在看到那些细节时的心情,又惊又喜,全然超乎于我的“小格局”,这种实实在在的东西摈弃了猜测和滥觞,用一个又一个的事实将我长期以来的人文情怀放在一边,于是我就觉得我的脑子里又多了一个极具现代意义的成员。许多人都是理性与感性并存,我也不例外,对于那些令人感动的经典文学我有我的敬仰,而这同样令人感动的现代主义我也给予我的尊重。大数据的时代必然会到来并且发展,那种智能化的社会将让无数人体验到什么叫科学与技术,什么叫真正的联系与共享。我不知道给它六十年的时间够不够让它与我相见。我看过一个视频,也是关于将来大数据时代发展对人类生活的影响,里面数据信息无处不在,桌子上,墙壁上,玻璃橱窗上,洗浴室内,全部都是信息数据共享平台,这种极大的便利的确让我很期待。对于城市发展,高度信息化数据化,将改变一个城市的面貌。我暂且想象一下,置身于空中,眼睛极度敏锐,放眼望去,那种先进与现代气息扑面而来,或许我可以看见一两无人驾驶的汽车正经过街道拐角,一家3D打印公司正在打印一双高跟鞋,一个绅士正在街头打电话,只不过对方等比例成像在自己眼前……只是,我害怕一件事,人类文明在长期的信息化发展中到底应该呈现出怎样的状态,那种高度便利是否会消磨人们对于人文情怀的追求。仅从书籍上讲,从古至二十世纪末,经典是不是在逐渐减少,特有的优秀文化现象是不是在高速发展中退出了舞台,那些依据事实以及特殊的时代背景所呈现出来的表现人文情怀的人类文化巨著是否会得到继承与发展,都是我内心的疑问。我不知道是不是因为我太过保守,或者说我还停留在守旧主义中,我也知道不同时代有着不同时代的经典,只是,科技能给一个人带来无数便利,却无法复制一个人的思想情感。于是,我有疑问:在大数据所带来的智能时代中,人文情怀、思想之美将以一种怎样的方式呈现并被后世人誉为经典?

数据之巅果然比大数据更上一层楼!对不起,太晚才捧起了你!让人欲罢不能,读起来一气呵成,内心澎湃的书!算是社科类,又算历史类,也算科技类,这种跨界科学作家让人崇拜!每本书的扉页都感谢妻子,感恩上帝!Big data, amazing and exciting! 可惜了,上次去深圳参加电子信息技术博览会,赶上涂子沛演讲,应该去讨签名的.....

组团阅读经管图书,有想参加的没?

AlphaGo人机大战三战三捷 打败阿法狗需要五个柯洁? 人工智能发展到这个程度 再不读书 就要被机器人虐了 ------------------------------------------------------------------------------------------------------ 知名金融人 政治家 企业家 倾情推荐十本经管系列图书 快来看看你应该读哪些书吧 ↓↓↓ 涂子沛 《数据之巅》 张维迎 《市场的逻辑》 张维迎 《理念的力量》 马尔科姆格拉德威尔 《异类》 德隆·阿西莫格鲁 詹姆斯·罗宾逊 《国家为什么会失败》 吴晓波 《历代经济变革得失》 彼得·蒂尔 《从0到1》 张维迎 《理解公司》 吴声 《场景革命》 丹·塞诺 《创业的国度》 ------------------------------------------------------------------------------------------------------ 沃兹基说过: 我们不能选择人生的起点, 但是可以通过阅读改变人生的终点 ------------------------------------------------------------------------------------------------------ 道理我都懂 然而让臣妾一个人看书 臣妾做不到啊 …… 没关系,有蓝筹 蓝筹带你一起读 ↓↓↓ 金融博物馆书院x蓝筹金融人才成长平台 推出100天读书计划 通过读书线上云课堂的方式 将读书的想法落实为具体的行动 以上10本图书 每10天阅读一本 根据科学的学习体系 在100天时间内完善自己的知识结构 站得更高,看得更远 ------------------------------------------------------------------------------------------------------ 每天25分钟阅读计划 每10天进行一次课程小测 微信群班级制学习 不定期邀请达人线上分享 学习共享 ------------------------------------------------------------------------------------------------------ 莫让浮躁蹉跎了你的岁月 莫让拖延浪费了你的时光 现在开始,行动起来 加入100天读书计划 每天成长一点 遇见更好的自己 ------------------------------------------------------------------------------------------------------ 点击【链接】报名 “100天读书行动计划” 【http://www.ilanchou.com/m/activity/index.html?activityId=2&inviteFrom=80000252044635】

从数据的角度讲文化

当初在听了涂子沛先生在华南理工大学的讲座后,想到从图书馆把这本书借来看看。现已看完前3章,感觉写得蛮好。目前的主线是美国利用数据的历史,同时穿插中国相应少有的一些数据利用的案例。让人真切感觉到了,数据收集,数据分析,数据预测的重要。

第三次工业革命

这是一本让人激动的书,拿起来舍不得放下,两天之内就着迷的看完了。里边的信息量很大,很有料。看着网上各家对该书的热议,我作为一个非互联网行业的门外汉感受到的是一种新革命到来的兴奋。无论是从3D打印,无人驾驶,人机交互的智能机器人,智慧城市,智能家居等等一切传统领域的被颠覆。目前炙手可热的可穿戴,智慧医疗,教育,交通,电子政务等等,感受到的是混沌中的兴奋,看着身边众多初创企业的爆发,消失,一切都在快速的发生,庆幸自己身处于这个变革的时代,变革的中心。

站在数据的肩上

站在数据的肩上文/王传言【《数据之巅》,涂子沛著,中信出版社,2014年5月】大数据、物联网、云计算,这显然已经成为信息社会面临的重要课题。由此,各类相关书籍开始呈现喷薄状。这些书籍从技术的角度,以专业的背景,将大数据描绘成为一个蓝图。不过,对于非专业领域的人来说,这样的书籍可能难以消化。这并非说明这些书籍写得不够好,而是这些书籍都仅仅是从技术的角度分析了数据,给人一种特别干枯的感觉。即如此论述的书籍并非能够深入经济、政治以及社会制度的深层次,成为一种浮光掠影的解说。而涂子沛的《数据之巅》显然延续着《大数据》的脉络继续开始讲述,他根植于美国社会的数据文化背景,又将目光投射到中国的未来之路上。可以说,脱离了纯技术范畴的大数据之作品,也是一种巅峰状态。如果说,《大数据》仅仅是将各种概念进行阐述。那么,《数据之巅》则将大数据革命,大数据的历史、现实和未来进行系统化的梳理。在《数据之巅》这本书中,从小数据时代到大数据的崛起,作者以宏大的历史观、文化观、大数据观,给我们描绘了一幅数据科学、智慧文化的全景图。全书从美国建国之基讲起,通过阐述初数时代、内战时代、镀金时代、进步时代、抽样时代、大数据时代的特征,系统梳理了美国数据文化的形成,阐述了其数据治国之道,论述了中国数据文化的薄弱之处,展望了未来数据世界的远景。而这些洋洋洒洒的内容都时刻存在于中西文化的对比中进行,尤其是美国的数据文化和中国进行对比。因为在作者看来,有对比才能有新的发现,发现对方的不足和优势。在作者的领域里,“数目字管理”屡次被提及,而这也是与大数据本身息息相关的概念。著名历史学家黄仁宇在研究中国明代历史中发现,缺乏“数目字管理”才是中西发展渐渐拉开差距的根本原因。而所谓的“数目字管理”其实也就是数据精神或者说是数据文化。而对于数据精神或者数据文化的缺失也造成了中国文化中特有的模糊现象,凡事都不精准。有鉴于此,胡适先生还特意撰写了著名的《差不多先生传》,从中不难窥见一斑。按照作者的意思,数据文化乃是一种追求精准、讲求事实、以证据为前提的文化。而这种文化必须要以数据为基础才能开展起来,这从美国的历史中就能够发现,无论是“一人一票”的民主形式,还是国民数据的汇总与统计,都深深浸透着数据文化的影子。他山之石,可以攻玉。现代中国社会,尤其是各个城市几乎都无一例外在进行智慧城市建设。这一点可以肯定。但是,需要看到智慧城市所需要的因素,那就是数据整理,即智慧城市需要各类数据,而在收集和利用数据的过程中又必然涉及到另外的因素。那就是关于个人隐私的界限。对此,在《大数据》中作者曾经给描述了一个像奥威尔《一九八四》小说中“老大哥”的形象。可以说,智慧城市的建设必然是未来中国的发展潮流,但也不得不警惕其中的隐私保护问题。因为在作者看来,数据以及数据文化的形成乃是中国未来需要走的一条路,但在这条路上如何保证公民的基本权利更是重中之重的任务,更有甚者,公民权利的重要性要远远大于数据的收集与运用。站得更高,才能走得更远。站在数据的肩上,才能窥探人类未来的方向。然而,探究未来必须牢固了解过去的历史。《数据之巅》也提出了这样的思考问题:数据其实从来就存在,只是看人们如何收集,如何利用罢了。而只有在收集和利用的过程中才能发现隐藏在数据背后的各种文化之间的差异。美国笃信数据从而形成了凡事讲究证据的文化;中国凡事“差不多”的思维形成了特有的模糊概念。可以说,未来中国智慧城市、制度创新和科技创新都依赖于各类数据,而如何正确收集,有效利用将成为一个产业链条上显著的环节,从而让数据也变得如此有魅力。

何谓“大数据” by 徐子沛

第七章: 大数据时代:通往计算型的智能社会原文:徐子沛整理&补充:喷嚏Q:什么是大数据?何谓“大”?“数据”为何?A:图形、语言、文字这三者并不能准确地描述世界,而且这三者的描述中主观色彩过于浓厚,容易造成误解。为了客观&精确地进行描述,数据被人类发明出来。(小插曲,现在我们使用的十进制仅仅只是因为人类有十只手指,如果人类有十二只手指的话,那么现存的运算可能会换下汤但是不换药。当然,还真的有使用十二进制的民族:玛雅,不知道它灭亡的原因和此有关否?哈哈,上述论断十分不严谨,请忽略~)在以前,至少是计算机出现前。数据加上背景就成了信息,经过人类整理归纳的信息则会转变为知识。不过,由于计算机存储是依赖二进制的,图片、语音等信息的本质也是数据,所以现在,数据同时也是信息的代名词。再来谈谈“大”。“大数据”这个概念是在20世纪80年代被提出来的,此时的“大”指的是数据相对于软件的重要程度(内容重于载体)。而在21世纪前十年,尤其是2004年社交媒体产生后,“大”这个概念开始向容量偏移。不过徐先生认为“容量只是表象,价值才是本质”。Q:孕育大数据的土壤有哪些?A:主要有三:1. 硬件——物理存储器的性能和大小。摩尔定律成真——同一面积芯片上可容纳的晶体管数量,一到两年将增加一倍。一兆字节存储量的成本由1955年的6000美元下降到今天的0.005美分。2. 社交媒体时代的到来。进入web2.0后,人类对自己行为的记录开始成为这个世界数据的主角,至少在容量上是这般。3. 数据挖掘&机器学习。其中机器学习基于的是带有自调适参数的算法,从数据中学习then找到真正有价值的知识。Q:大数据能生出怎样的蛋?A:用于社会计算去捕捉“人类历史上过去难以被捕捉的关系和知识”。例如,通过分析几千封名人之间的通信去研究文艺复兴时期特定新思想的首创者。当然还有孜孜不倦追求金钱的商家,他们能用数据换钞票。Q:未来是怎样?A:“万物皆联网,无处不计算” :1. 最大的工业制造商通用电气要通过安装数以万计的传感器来监视一座厂房的运营情况,进而生产效率。2. 谷歌收购智能家居设备商Nest,哦,花了32亿美元。3. 世界会需要一大批数字机械工程师、软件工程师、数据科学家和人机交互界面专家。Q:数据和计算在第三次工业革命中的作用是什么?A:这得从3D打印机这个公认的工业4.0中最活跃的元素讲起。首先,每个用3D打印机完成的实物背后都有一个对应的数据包。其次,“3D打印”这个名词背后默默站着“众包”这个贤内助,而后者身上蕴含的,是巨大的社会能量。(看维基百科就知道啦!)以上两点构成了将来大数据的重要类别之一:物理实体的数据。同时3D技术加上大数据加上众包就构成一个即将到来的名词——社会制造!Q:数据之巅上站着谁?A:智能型社会——机器通过收集大量数据获得知识,自动完成任务。

摘录一点语句

每一个来开会的人,固然带来了他的智慧,但同时也带来了他的偏见。向大海进军反对奴隶制并不代表支持人人平等,这也反映了人性极为复杂的一面。就使用数据的方式而言,谢尔曼要高出一筹。数据除了代表事实,还蕴藏着事物的发展规律。未来的美国历史不应该是这样,它还应该是普通人的历史。普查使新的历史记录成为可能。利益的调整充满了试探、算计、对抗和冲突,向来都难以一次到位。政治和行政两相分开,分肥制只适用于少数政治职位,行政部门的公务员必须通过考试、择优录用,同时不能加入任何党派,即保持政治中立。汽车公司应对政府提高安全标准的三种手段:一是不断提起申诉,拖延规定出台的时间;二是指证政府的规定“药不对症”;三是向政府诉苦,罗列种种困难,争取时间。越来越多的大公司拥有了媒体,自然,新闻调查报道的力度和深度随之下降。我们需要多个模型,进而从不同的视角来观察、比较、理解同一问题。新的统计革命认为,社会调查可以通过选取部分有代表性的样本来完成,即抽样。诱导式提问可能得出不客观的结论。金钱不是提高工人积极性的唯一动力,人不仅仅是经济人,也是社会人,要调动每个人的积极性,还必须从社会、心理方面努力。生产过程产生偏差,原因可分为两种:一是特殊原因,二是共同原因。偏差控制图为每个偏差定义了一个变化的上限和下限,一旦波动超出了这个界限,就说明可能发生了特殊原因。特殊原因应当首先被消除。上帝的孩子、他人的朋友、虔诚的基督信徒。对内开放的程度应该远远高于对外开放的程度。这是人类控制数据最重要的手段,即控制数的产生方式以及对数据的解释方式。国会议员是否应当享有自由买卖股票的权利,发现最好的办法就是财产公开。上百万的孩子需要我保护,不能让他们失望。整个美国可能陷入震惊,但总统不能。困难并不在于统计的方法和技术,而源于不同政府部门之间的合作障碍。开放的不仅仅是数据的使用权,还包括数据的所有权。未来政府的信息一经产生,其默认的形式就应该是开放的、机器可读的。对已有数据的整合和利用,通过整合,老“数”可以新用。过去深入群众、实地考察的工作方法虽然仍然有效,但对决策而言,系统采集的数据、科学分析的结果更为重要。离开数据,就没有科学而言。数据三大来源:测量,记录,计算。容量只是表象,价值才是本质,大容量并不一定代表大价值。存储器的价格几乎下降到原价格的亿分之一,没有其他任何一种产品的价格下降空间能够如此巨大。计算最终将和环境融为一体,这被称为普适计算阶段。亚马逊的预判发货,如果能够缩短物流时间,将极大改善客户体验。数据挖掘将成为越来越重要的分析预测工具,抽样技术将下降为辅助工具。这种分析是实时的,没有滞后性。一定程度上,数据挖掘已经不是大数据的前沿和热点,取而代之的是机器学习。社会正逐渐变得可计算。大数据的特点除了“量大”,还有“多源”。大数据将成为我们下一个观察人类自身行为以及社会行为的“显微镜”。人类和计算机交互的方式:代码,图形,声音,脑电波和眼睛。在智能时代,是机器开始向人靠拢,主动理解人,为人服务。有经济学家支招说,开征计算机税,使用计算机和自动化越多的公司,必须缴纳更多的税收,国家可以用这部分钱来补贴失业群体。技术的发展给我们带来的难题,同时又给我们开出了处方。

no measurement,no management

从美国历史的角度出发,讨论美国是如何在数据的帮助之下走向强大的。1初数时代:用数据奠定民主和共和,人口普查源于用数据分权的制度安排。2内小时代:数据是武器。3镀金时代:统计驱动商业和政治进步4量化:进步时代,成本收益借助数据,为错综复杂的利益之争提供了一条客观解决问题的途径。中国社会急需普及数据文化和量化意识。5抽样时代:统计在质量体系中的作用6开房时代:数据的来源拥有对数据的所有权和使用权7大数据时代:天时地利人和。摩尔定律支配下的存储变得越来越便宜,社交媒体产生了海量非结构化数据,数据挖掘通过特定的算法进行自动分析,从而揭示数据之中隐藏的规律和趋势,更牛逼的是机器学习可以随着计算和挖苦的次数增多,不断调整自己的算法。大数据成了新时代的显微镜。

未来已在身边

这是一本数据处理方向回顾过去总结经验的历史书,这也是一本眺望远方指引未来的方向书。
我向来自诩是学数据挖掘的,但心里也明白,自己水平有限,往往沉溺于基础具体的项目中,热衷于运用书本的知识花哨的完成任务(想想真是幼稚)。看了这本书以后,感觉整个人的层次都提高了。如果说《赤裸裸的统计学》是让我打牢地基,端正价值观的话,那这本书就是让我明白,“大楼”应该建设成什么样子。
书中大部分篇幅是在回顾历史。以美国的数据处理发展为主线(人家确实先行一步),从数据的最初,服务于权利分配的人口普查,到要求数据服务于商业生活的数据收益分析,再到现在的数据公开与数据挖掘。行文一气呵成,脉络清晰主次分明。各种各样的实例如果说是每本好书应有的基本特征,那对于实例详尽的分析外加入木三分的评论,就是本书的区别于其他的魅力了。从政治到战争到生活,从商业到环保到文化,书中带我看遍生活每个角落隐藏的数据,和这些数据支撑起的现代文明。读完后我惊叹和骄傲——原来,我学的东西离生活已经没有距离了。
剩下的部分就是对未来数据的预测了。书中引用了一句话:“未来 已经到来,只是分布不均匀而已。”未来,可能真的来了,而我们需要做的,只是找到它而已。我也十分赞同书中关于数据的一个的观点,就是数据的在未来作用是让世界智慧化。数据变成信息,信息变成知识,知识变为智慧。这个发展主线有提纲挈领的作用,让我豁然开朗,醍醐灌顶。
当然,看了序言和后记之后,我感觉本书有些许为神州和中信做广告的嫌疑,但仅仅是感觉,而且就算是,也是白璧微瑕,无伤大雅。
思想深刻,有观点,心事浩茫连广宇;文字平淡,不做作,于无声处听惊雷。

像《教父2》一样好看的续集

一般而言,一本书走红后,跟风出的续集都不太好看,但涂子沛这本有些例外,如果说第一本主要是概念辨析和普及的话,那这一本主要是讲历史和现实中的数据应用,特别是本书开头几章,梳理数据统计在美国史上所发挥的重要作用时,非常有启发性,可以说是透过数据看历史,也展示了下如果要围绕某一主题来梳理历史,该怎么组织材料展开论证,每章开头的名人名言,中间的故事讲述,月旦人物,图表呈现,甚至每个章节的引文出处,基本上做到了学术性和趣味性兼顾。ps:读此书还有个意外收获,就是深感过去政治课对美国政体的评介何其肤浅粗率误人子弟,当然也怪自己不求甚解,只模糊留下了美国两院两党争论不休的印象,但两院如何产生,两党差异何在,却一无所知,这本书讲的清晰明了,对美国政治感兴趣的也可以看看。

对数据认知和使用影响美国历史的发展

从参众议院的席位设置,体现数据最初是用来平衡各方的利益从南北战争,说明数据可以用来保障军队的后勤从行业指数,说明数据可以用来了解发展规律从交通事故,说明是否用成本收益分析法来影响未来的数据数据的准确性越高,从事数据搜集、整理的人员的素质要求越高,从而产生独立的专业机构,提供不被政治左右的事实和数据,不提供对事实的理论解释,也不介入政策的制定数据量增加,要求处理数据的技术创新,陆续出现了打孔机、计算机数据要保证真实性,

读这样的书也能读的流眼泪,你信吗

关于戴明在日本布道的那一段,看的眼泪哗哗的,可能是脑子里的网被触动了,不能自禁。里面的很多内容像在讲故事,比较吸引人,但是却引人深思。我仿佛看到了未来,正在徐徐走来,站在现在这个节点上,看看过去,心潮澎湃,展望未来,无限期待!

社会、技术、政治、历史的融合

大领导推荐的书,力荐。天朝在紧张的抓老虎,老百姓欢呼雀跃,叫好声一片。读过此书,才理解什么是政府的“作为”,为什么信息产业会扎根发展在硅谷。什么才是推动社会进步的动力。感觉对于传统程序员,错过了互联网那波,下一波,没有在数据挖掘圈里,那么就在统计分析的路上。

什么东西到了第2集,往往都比较2。

【关注微信平台bdbigdata】买了一本涂子沛的《数据之巅》来看,看完以后有点失望,什么东西到了第2集,往往都比较2。这是个规律。这本书也不例外。作者开始在书中植入广告了,还特明显。作者如果不好好写书的话,那就没影响力。

数据是个好东西

图书馆借了两本书,《文明的冲突》兴趣不大,拿起又放下,但这本《数据之巅》我却拿得起,放不下,一口气读完。从美国建国开始,到现在的世界第一大经济体,数据在其中发挥了重要的作用。作者引用了美国总统加菲尔德在对美国人口的普查体系改造之时发现数据中不仅蕴藏着社会发展的规律,还提供了一种全新的历史书写方式“直到现在,历史学家还是以一种总体的形式来研究一个国家,他们只能给我们讲述帝王将相以及战争的历史,但关于人民本身——魔门庞大社会中每个生命的成长、各种力量、细节及其规律,历史学家说不出太多的同喜·····而普查吧我们的观察放大到民房、家庭、工厂、煤矿、田野、监狱、医院等能集中展示人性之强大及脆弱的搜有地方,这让新的历史记录成为可能。”就本人而言,以前不知道民主和共和的区别,不知道即使是南北战争大家也在用数据说话,不知道成本收益方法如此重要,而这本书,让我从另一个角度看到 了美国的发展史。美国的强大,是以其强大而开放的数据统计、和开放的数据平台为基础的。反观中国,差距很大,数据开放的脚步很慢,且不说做到以数据开放推动创新,就是让老百姓的知情权得到保障,还有很长的路要走。美国的历史,日本二战后的奋起,是经验,我们参考,我们借鉴,让我更好更快的成长发展。作者也对大数据未来的发展进行展望,指出计算型的的智能社会将是当今后的发展方向。我想,在这方面,各种网络公司对大数据的利用已经走在世界前列,淘宝京东等等根据各种数据将其产品销量调查进行“众包”,使其不费一兵一卒即可知道大众的购买习惯,从而制定出最有利的营销活动;而智能社会、智慧城市的建设,政府还得是主导,发展经济,企业是力量,所以,这本书,更多的人应该多读读。

速读数据之巅

一周三五天的时间,快速读了一遍。感觉上这是一本讲述了数据在一个国家发展历史中的作用的书。作者详细的追溯了美国国家历史上数据与统计的各种应用,从独立战争开始,到后9-11时代。书中也不可避免的提到了中国在这一浪潮中的种种。大数据,所有的应用看上去是那么美好。前提是真的能够如实的获得如此之多的数据。虽然对于大型企业,特别是寡头垄断企业,这样信息的获得更为容易。相对的,对于那些挣扎在竞争缝隙中的小型企业和个人来讲,他们能否接触到这些大数据,他们如何凭借几乎是个人的力量来分析这些数据,是不是太难了?这会不会导致资本的进一步分化?看来这个富人更富的规律似乎依旧正确。

270第七章

大数据的概念和维度。大数据=传统的小数据 现代的大记录大数据=结构化数据 非结构化数据大数据=大价值 大容量一张图表清清楚楚。提纲挈领,醍醐灌顶。从美国的建国历史开始讲起,讲述数据文化是如何形成的,在治国理政中由问题牵引,逐渐在解决问题的过程种形成了一系列的做法,同时引向未来,现在和未来数据文化在我们的社会生活中还能发挥怎么样的作用!作者用一本书的厚度告诉我们:数据文化是尊重事实、强调精确、推崇理性和逻辑的文化。数据文化之匮乏,是中国所以落后的一个重要原因……我这种最讨厌数字的文科生也看得脑洞大开!真的是好书


 数据之巅下载


 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024