《数据统治世界》书评

出版社:Numbers Rule Your World: The Hidden Influence of Probability and Statistics on Everything You Do
出版日期:2013-9-1
ISBN:9787300177540
作者:[美]冯启思(Kaiser Fung)
页数:248页

阐释统计和数据分析的实际应用的佳作

书的内容比较简单,但是很值得一读。书主要讲述统计和数据分析在日常生活中的应用,读起来比较有趣,同时也能启迪思维。个人来说,最大的启迪有几点:1.人性、心理学的重要性迪斯尼深谙人性的洞察,可感知的等待时间和实际的等待时间是两码事。应用科学时,不能仅仅关注数学上的效用,也要关注人们的心理感受。2.权衡折中现实生活是灰色的,黑白两个极端只存在于理论之中。统计和数据分析应用当中,也存在很多类似的权衡折中。假阴性和假阳性往往是一对跷跷板,此起彼伏。

数据正在影响你的工作和生活

虽然我们现在热议大数据时代,开始到处谈论“大数据”。但其实,在我们的生活中,数据无处不在,当我们买彩票时,彩票的中奖概率组成了数据,当听到飞机失事时,我们又会看到相关的统计数据,更不用说经常听到的国民统计数据,还有一些以据调查显示开头的新闻了,甚至还会有关于“人们是否相信统计数据”的调查数据。由此,你是否想起了最近听到的统计数据呢?我们先以你我最熟悉的彩票故事为例,人们买彩票时,是否有想过自己中大奖的概率?理论上说,每次彩票抽奖都是随机抽取的,与上次的结果和上上次的结果毫无关系,但还是有不少人在拿着以往的数据在预测未来,期待自己能成为下一个幸运儿。但不幸的是,实现这样的梦想总归也没有几人,让我们再来看一下乘飞机出行,每当我们看到飞机失事的时候,总是想飞机太不安全了,当下次有机会在飞机和地面交通中选择的时候,都义无反顾地选择了地面交通。这样做对吗?这个时候,统计科学家出现了,他们明确地告诉我们,飞机失事的概率和买彩票中的概率差不多。人们都在妄想买彩票中大奖,获得巨额财富,而又惧怕坐飞机,怕自己成为受害者,但两者的概率并无太大不同。事实上,这正是小概率的力量,在《数据统治世界》中,作者冯启思用这样一个故事为我们讲述一项统计式思维,“小概率的事件的发生性几乎为0”。其实,作者在讲述买彩票的例子的时候,是用这样一个故事来引出的,在加拿大,因为一桩彩票店店员将一名老人的中奖彩票据为己有的案例,让应用统计学家发现,彩票店店员的中奖概率要高出普通人的4倍!这不科学,因为发生这样的事情的概率只有10的十六次幂分之一(已经非常非常小的一个数字)。 你应该明白了,在这个问题上,两名专家分别就彩票店中奖概率和飞机失事概率进行了研究,他们使用到的统计学思维便是“小概率事件不会发生”。因此,对他们来说,彩票对他们毫无吸引力,而且也十分信任自己乘坐的飞机。在《数据统治世界》一书中,包括“小概率事件不会发生”,作者总共介绍了5条统计式思维:“留意事件中的变异性”“从事实中发现有用信息”“同类进行比较”“两种错误之间的此消彼长”“小概率事件不会发生”。而他们又分别对应了十则精彩动人的故事,迪士尼的等候队列与明尼苏达州高速公路匝道,美国大肠杆菌流感与信用分评分,SAT考试测试与佛罗里达州的飓风保险,兴奋剂检测与测谎仪,异常的彩票中奖率与十分巧合的飞机失事事故。这十则精彩的故事,在每章中通过交叉叙述,事件发展跌宕起伏,作者带领着读者一步步探寻事情的真相,初次读来,本以为事情应该就此打住时,作者却又从新的线索或角度,将我们拉到另外一条精彩的故事线上,由此产生极好的脑力激荡。当你读完本书后,你在面对数据时,就可以通过新的角度,利用这些统计式思维重新审视我们身边发生的故事,和那些浮现在表面的数据,来揭示隐藏在数字背后的奥秘和数据的神秘力量。

统计思维的科普读物

这本书应该算是一本统计思维的科普读物,虽然看上去不算薄,但读起来很快。建议快速浏览前5章,精读后记,有什么不明白的可以回去前5章看看。另外,出版单位在书尾附了一篇小文章《商业书籍的阅读方法》很值得一看。

花一天时间读完之后的读书总结

标题的名字有点哗众取宠,不过书当然是好书。是很好的统计学思维入门书。第一章:强调某些事物的特征有类似于木桶原理:运行效率取决于所有发生的因素中的最小值,而不是其均值。探明事物发生的性质本身,找到其实在的依赖关系,而不要仅仅把思维局限于改变均值,关注变异,更能够解决问题。想到武汉的交通堵车,有些人认为不是因为车多,而是因为有些不守规矩的行为导致行车速度变化大,拖累后面所有行车人员,从而总行车时间增加。如果控制开车行为,减少使车速降至极低事件的发生概率,车多造成的拥堵问题没那么大。第二章:相关关系和因果关系在运用上不同。有些重大的事件影响深远,必须严密地探察出其原因,才能在解决问题的同时带来的伤害最小。而另外一些事件,原因众多纷纭,找到真实原因即使可能用处也不是那么大,在此时找到相关关系足够运用于实际决策,那么相关分析不需要真正探明因果关系。真正的因果可能会在逐渐寻找相关中显现出来。第三章:相互比较得出结论需要其他条件一致,这是一种基本的科学方法。在统计中做决策也是如此,不能把苹果和橘子进行比较。因此需要比较不同的组之间的差别。只有在组间其它因素都相同时才能说明想要的结论。这也是计量经济学中控制变量和匹配的想法了。分组不当会引起所谓的道德风险问题,无端招致更多的风险使总体缺乏效率,同时也有风险低的补贴风险高的不公平现象。第四章:弃真和取伪是一个跷跷板的关系,不改变估计方法或者样本容量,是无法同时减少二者的。这个在计量经济学中的运用是在做检验的时候,会有一个原假设和一个备择假设。以谁为原假设会对其有保护作用,而对备择假设比较挑剔,除非有很强的证据证明,否则不予接收。而做计量回归中,我们希望得到原假设不成立,以接受备择假设的意思是,我们希望接受的备择假设是在有充分证据的基础之上,因此是(从可得到的数据来说是)可靠的。在实际生活运用中,保护哪个,苛责哪个,取决于各自的收益和成本对比。如同食品药品监督局所承担的风险一样,冤枉了一个好的固然不好,可是没什么大问题,放过了一个坏的,可就备受批评了。因此原假设就是东西是坏的也就可以理解了。同时也可以说明,无罪假设需要对违规分子处于严厉的处罚,因为这是认为,一个人违规被抓只是众多违规行为的冰山一角,平时就干了不少坏事才会“天网恢恢,疏而不漏"。这样才能制止违规行为。第五章,小概率事件不可能在一次随机试验中发生。这几乎算是统计学家的信念了。但是小概率事件有吸引人的故事性,从而博得人们的眼球。同时,如果理论上小概率事件的确很凑巧地发生了,除非经过第四章取伪和弃真严密地考察排除一切可能,否则我们就要怀疑它是我们假设的随机发生的性质了,或者说我们要怀疑它的样本空间是不是原来那个。普通人没有所谓的统计思维或许是因为他们没有机会看见众多的正常事件或者忽略掉了它们。


 数据统治世界下载 精选章节试读


 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024