统计思维

出版社:图灵教育
出版日期:2013-5
ISBN:9787115317377
作者:Allen B.Downey
页数:160页

章节摘录

版权页:   插图:   习题3—1按照院长的方法构建这些数据的PMF,并计算均值。因为数据是分组的,所以可以用每组的中点值。 然后再从学生的角度来构建选课人数的分布,并计算均值。假设想要得到学校每门课程选课人数的分布情况,但又无法从院长那里得到可信的数据。其中一种解决办法是随机选择一组学生,然后询问他们所选课程的上课人数。然后可以根据调查的结果计算出PMF。这个结果是有偏差的。因为选修人数多的课程会被过采样,所以在估计选课人数真实分布时要对观察到的分布做一个合适的变换。编写一个UnbiasPmf函数,参数是观察值的PMF,返回据此估计出的表示选课人数分布的Pmf对象。 答案可以从http://thinkstats.corn/class—size.PY下载。习题3—2 在大部分的田径比赛中,选手都是同时出发的。如果跑得快,那么在比赛刚开始的时候会超过很多人,但在跑出几英里后你就会发现,周围都是跟你速度差不多的选手。 我第一次参加长跑(209英里)接力时,注意到一个奇怪的现象:当我超过其他选手时,我会跑得更快;当其他选手超过我时,他们通常也会跑得更快。 一开始,我觉得速度的分布是两级分化的:速度快和速度慢的人都很多,但跟我速度差不多的人应该不多。 但随后我发现我的选择是有偏差的。这个比赛有两个特点:分阶段出发,不同的队伍出发时间也不同;此外,同一个队伍中选手的水平也参差不齐。 因此,选手在比赛道路上所处的位置与其速度和名次没有什么关系。在我开始跑时,我周围的参赛选手基本上是随机的。 那这其中的偏差来自何处?在整个比赛过程中,超过其他选手或者是被其他选手超过的概率跟选手间速度差异的大小是有关的。为什么?想想最极端的情况。如果我跟另外一个比赛选手的速度完全一样,那我们就不可能超过对方,也不可能被对方超过。如果某个选手跑得特别快,在我跑的过程中跑完了全程,那这位选手肯定会在某个地方超过我。写一个BiasPmf函数,其参数是表示选手速度实际分布的Pmf和观察者的速度,返回值是一个新的Pmf,表示其他选手相对观察者的速度分布。 用一般的道路比赛(不是接力赛)的数据测试函数。我写了一个程序读取马萨诸塞州Dedham的James Joyce Ramble一万米比赛的数据,并将每个选手的速度单位转换成m/h。可以从http://thinkstats.com/relay.PY下载这个程序。运行该程序,看看速度的PMF。

内容概要

Allen B. Downey是富兰克林欧林工程学院的计算机科学副教授,曾执教于韦尔斯利学院、科尔比学院和加州大学伯克利分校。他先后获麻省理工学院计算机科学硕士学位和加州大学伯克利分校计算机科学博士学位。Downey已出版十余本技术书,内容涉及Java、Python、C++、概率统计等,深受专业读者喜爱。他的最新Think系列书还有Think Complexity: Complexity Science and Computational Modeling、Think Python。

书籍目录

版权声明
O'Reilly Media, Inc.介绍
译者序
阅读
前言
阅读
第1章 程序员的统计思维
第2章 描述性统计量
第3章 累积分布函数
第4章 连续分布
第5章 概率
阅读
第6章 分布的运算
第7章 假设检验
第8章 估计
第9章 相关性
索引
作者及封面简介

编辑推荐

大数据革命风起云涌。数据分析成为每个浪尖上的舞者的必杀技。而统计思维是数据分析和数据挖掘的根基。每个程序员都应该具备统计思维,看到统计思维:程序员数学之概率统计你已经比别人先行一步。这是一本极为独特的统计思维入门图书。独特的编程视角。对于主要的概率统计概念,作者都给出了开源的代码示例,其新颖独特的讲解方法绝对可以让程序员对概率统计产生更深刻的认识。幽默风趣的示例。你是否一直无法理解蒙提霍尔问题?庞加莱是怎样发现面包商的企图的?作者援引经典问题,帮你打开统计思维。公共开源数据。拿来美国全国家庭成长调查(NSFG)与行为风险因素监测系统(BRFSS)中的数据,重用参考代码,立即让自己的代码跑起来。

作者简介

代码跑出来的概率统计问题;
程序员的概率统计开心辞典;
开放数据集,全代码攻略。
现实工作中,人们常被要求用数据说话。可是,数据自己是不能说话的,只有对它进行可靠分析和深入挖掘才能找到有价值的信息。概率统计是数据分析的通用语言,是大数据时代预测未来的根基。
站在时代浪尖上的程序员只有具备统计思维才能掌握数据分析的必杀技。本书正是一本概率统计方面的入门图书,但视角极为独特,折射出大数据浪潮的别样风景。作者将基本的概率统计知识融入Python编程,告诉你如何借助编写程序,用计算而非数学的方式实现统计分析。一个趣味实例贯穿全书,生动地讲解了数据分析的全过程:从采集数据和生成统计量,到识别模式和检验假设。一册在手,让你轻松掌握分布、概率论、可视化以及其他工具和概念。

编写测试代码深入理解概率论和统计学

运行实验检验统计行为特征,如生成服从各种分布的样本

通过模拟理解数学上艰涩的概念

学习贝叶斯估计等实用内容

用Python导入各种来源的数据

运用统计推断解决真实数据问题
《统计思维:程序员数学之概率统计》是一本以全新视角讲解概率统计的入门图书。抛开经典的数学分析,Downey 手把手教你用编程理解统计学。概率、分布、假设检验、贝叶斯估计、相关性等,每个主题都充满趣味性,经编程解释后变得更为清晰易懂。
本书研究数据主要来源于美国全国家庭成长调查(NSFG)与行为风险因素监测系统(BRFSS),数据源及解决方案的相关代码全部开放,具体章节列出了大量学习和进阶资料,方便读者参考。
Allen B. Downey是富兰克林欧林工程学院的计算机科学副教授,曾执教于韦尔斯利学院、科尔比学院和加州大学伯克利分校。他先后获麻省理工学院计算机科学硕士学位和加州大学伯克利分校计算机科学博士学位。Downey已出版十余本技术书,内容涉及Java、Python、C++、概率统计等,深受专业读者喜爱。他的最新Think系列书还有Think Complexity: Complexity Science and Computational Modeling、Think Python。


 统计思维下载



发布书评

 
 


精彩短评 (总计54条)

  •     写的像数学教材,但是又不够细,一般吧
  •     和电风扇一起买的, 结果书被电风扇从中间给压折了,电子产品经常会在卓越网上买, 物流比较给力,也有保障, 现在看来有点折扣
  •     1.主要就是知道些术语,解释得不清不楚; 2.就翻了一下,算过了,以后需要查某些概念的时候,拿出来翻翻。
  •     还行啊
  •     要是习题有答案就更好了。^_^
  •     优点是告诉读者概率和数理统计能做什么。
  •     各种习题例子都很有趣,可惜不知道答案,而且只尝试了有兴趣的题目。算是入门的好书了
  •     这书最后两章写的有点急了,就像考试没做完赶着交卷子似的。但是前面的概念阐述都蛮清晰的,我也跟着写了一些代码,但是后来主要是吃早餐的时候看,所以代码就没坚持写,但是觉得比国内的教科书写的好(我能说过去我不知道概率密度函数确切物理意义么,捂脸跑。。。。。。。)在读第二遍,这本书很基础,但是对概念的阐述非常清晰,学过概率统计,而且还拿了个优,但是后来已经不记得什么了,因为过去对基础概念都没有彻底搞明白。这本书帮我做到了,但是还是有点小瑕疵,后面阐述的急了。还有一个就是,对于每个数学概念我觉得都可以抽象到自然界哲学高度来理解,知道的越多理解的越深,对自然越发敬畏!
  •     简单统计量的计算机算法实践
  •     短小精悍推荐一读
  •     :无
  •     感觉一般般,比想象中的薄
  •     简单,概率、统计扫盲
  •     虽然讲的都是基础,不深入。但是讲法巧妙。有时候看了国外的书,就觉得那句“中国人是最聪明的民族”简直是扯淡中的扯淡
  •     基于Python的
  •     挺好的入门,说得虽然不是很详细,但是基本概念说得清楚,不懂的自己google吧
  •     内容太浅太简单了……
  •     作者是Python高手这点很难得,这本书虽然是在讲统计学基础,但代码是亮点,一定不要错过。
  •     小白入门
  •     没啥用…… 通篇自己造轮子…… 我觉得一本实用的python统计教程应该基于scipy和matplotlab系列库,而不是用python具体实现一些简单的统计函数……
  •     概率统计的入门书籍
  •     还没开始看,就给个喜欢吧。。
  •     有时间拿来读一读,挺不错的
  •     绝对的业界良心!http://greenteapress.com/thinkstats/ 他的另一本书Think Python - How to Think Like a Computer Scientist好像也不错:http://www.greenteapress.com/thinkpython/
  •     有问题上网查,别买这本
  •     书很小,没事的时候翻翻来看,里面还是有些有意思的东西。python讲统计,重在实践。
  •     条理非常清晰的工具书。
  •     如果你学过概率统计,并且会上网,不要买这本书,wikipedia查询一下就行了
  •     拿着后发现书有点薄,希望看后能有所帮助
  •     写的太简略了,读的好累。。。
  •     必须跟着走一遍才有效。上学的时候有就好了。
  •     “如何给Python程序员讲统计里的基本概念”。想做小而全是不可能的,所以越往后概念讲得越泛。
  •     还不错,内容讲得比较浅也比较通俗易懂,没事拿来消遣还是不错
  •     按体积来说 感觉价格贵多了~书本就像一本英语背单词的小册子 不过 毕竟知识无价 还是很感激的
  •     现在串起来把东西看一遍下来就当是复习吧
  •     概率本身都没讲好,给的题目和代码又有什么用呢?应了题目,统计思维,就是你看了就了解这个“思维”,仅限于此了。
  •     普及知识
  •     还不错 简单入门
  •     我觉得这本书蛮不错的,为什么评分这么低,当然也有可能是我统计刚入门。。。
  •     一般的书,不好也不差。书很小很薄!
  •     不知道是翻译还是原作的问题,写得乱七八糟
  •     如果想要找统计学或者概率学入门的朋友,不推荐读这本书。
  •     比较简单,适合在地铁或者坐车的时候看看。讲述了一些基本概念和小故事。但是,代码和许多细节都需要在线下载程序和登录相应的wiki,因此感觉适合看电子版的,方便随时下载相应代码,以及查阅网页。
  •     先把文字部分看了一遍,算是复习了一遍统计学,有空再研究他的代码,这个是重点。
  •     又一本教案,说明性内容居然少于习题
  •     写给高中毕业程序员的统计术语词典~
  •     Python基础统计运用!
  •     o'reilly的动物书质量都是有保证的。这本书将涉及的还是比较广的。例子都是用Python写的
  •     不好
  •     这本书适合你入门了统计学、概率统计后再翻一下。实用的工具书。
  •     #豆瓣阅读# 于不懂的人太皮毛,知道名词和实现有什么用,怎么有中国人写的高数书的感觉;于懂的人太罗嗦,这这这你都能写一本书?
  •     虽然书挺薄,但是内容很实在,每一点吃头都要花一些实现
  •     挺好的书啊,我这个小白看看充充电,挺好的
  •     蜻蜓略水般的简介,复习旧概念,和新概念混个眼熟,仅此而已。
 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024