《统计建模与R软件》书评

当前位置:首页 > 社会科学 > > 统计建模与R软件

出版社:清华大学出版社
出版日期:2007-5
ISBN:9787302143666
作者:薛毅
页数:525页

关于工作中使用到的统计知识

这本书是将教材课本中介绍的统计方法与计算机语言R进行结合,通过编程实现对统计学理论知识的理解,通过接口封装,进一步增加了其可用性。整本书的使用价值很高,通过理解其中的实例,结合自己的工作,你会有更深的心得体会。这本书就是两条线,一条线是统计学中的各种基础知识和方法,另一条线是R语言实现。然而这两条线如果放在过去,那么我一定会在一段相当长的时间段内不断分别沿着这两条线去琢磨。可以说,这两条线非常复杂,内容也非常多,按照这种读书方法最终收获的是“模糊的记忆”,没有什么系统性的感触,也没有与工作结合的认识。现在看来,我觉得一种比较好的阅读本书的方式是划分成如下几步。第一步,粗看目录,知道整本书的大体框架;第二步,看每一章的序或介绍,通过看序,知道每一章的核心要解决的问题是什么;第三步,看每一章的实例,知道解决实例的方法。【通过目录看书的框架】要了解统计学的基本知识,那就是chapter1;要了解R语言的语法,那就是chapter2;统计学与R的初步结合,基于描述性分析,那就是chapter3,其中用R画图也是本章;个人认为本书最大价值在于5-9章。假设推断 in chapter5;回归分析 in chapter6;方差分析 in chapter7;判别分析与聚类分析 in chapter8;主成分分析、因子分析、相关分析 in chapter9;ok,第一步达到了,本书的框架就是理论到实践的打通,由浅入深。【核心关键词的含义】你知道的分布有哪些?均匀分布、正态分布、泊松分布、卡方分布;统计分析:分为统计描述和统计推断两个部分。统计描述:是通过绘制图表、计算统计量等方法来描述数据的分布特点。是数据分析的基本步骤,也是记性统计推断的基础。统计推断:主要包含参数估计和假设检验两个主要内容。参数估计:通过样本来估计总体分布所包含的未知参数,叫做参数估计,是统计推断的一种重要形式。常见的方法有两种,一种称为点估计,另一种是区间估计。假设检验:通过样本数据对某个事先做出的假设按照某种设计好的方法进行检验,判断该假设是否正确。是统计推断的另一种表现形式。假设检验的参数方法:在统计推断问题中,如果假定或者给定了总体分布的具体形式(如正态分布),只是其中含有若干未知参数,需要基于总体的样本对参数做出估计或者进行某种假设校验,这种推断方法称为参数方法。假设检验的非参数方法:在许多实际问题中,都不知道总体是怎样的一种分布,很难对总体分布做出正确的假定,对于这种不假定总体分布的具体形式,尽量从样本本身来获取所需要的信息的统计方法称为非参数方法。回归分析:变量间的关系有两类,一类是完全确定的关系,可以用函数形式表示;还有一类是变量间有一定的关系,但是由于情况复杂或者存在不可避免的误差无法做到精确确定,为了能够研究这类变量之间的关系,常常通过大量试验或观测获取数据,用统计方法去寻找两者之间的关系,注意,这种关系反映的是变量间的统计规律。这种统计方法便是回归分析。方差分析:在实际工作中,影响一件事情的因素有很多,人们总是希望通过各种试验来观察各种因素对试验结果的影响。方差分析就是研究一种或多种维度的变化对试验结果指标是否有显著影响,从而找出较优的试验条件或者生产条件的一种常用统计方法。基本目标就是通过比较各种原因在总变异中的重要程度,对原因进行排序,从而实现下一步工作方向的确定。判别分析:也就是机器学习中的有监督学习,鸡仔已知有多少类的情况下,并且在有训练样本的前提下,利用训练样本对数据进行分类。是用于判断个体所属群体的一种统计方法。聚类分析:预先不知道有多少类别,很据某种规则将样本进行分类。是一类将数据所对应的研究对象进行分类的统计方法。主成分分析:PCA。是将多指标化为少数几个综合指标的一种统计分析方法。通过降维技术把多个变量化成少数几个主成分的方法。这些主成分能够反映原始变量的大部分信息,通常表现为原始变量的线性组合。因子分析:是PCA的推广和扩展,也是降维的一种方法,是一种用来分析隐藏在表面现象背后的因子作用的一类统计模型。相关分析:分析两组随机变量之间相关性程度的一种统计方法。

使用顺序

看完这本书后,个人总结的学习顺序建议:如果你的计量统计基础超扎实,直接看第二章看起,后面每一章直接做例题,R就学的差不多了。如果计量统计基础不扎实,先看一遍第二章,然后返回第一章,然后跳三章,顺序看下去,这一遍只看理论讲解部分,看完一遍后,再返回第二章,第三章,顺序看下去,这一遍重点做题,当然是在R里模仿书中例题写一遍。我感觉光看,不上手,效果还是不行的,必须得上手写程序,这样才扎实,使用的时候才能想起来。缺点:书中的计量和统计部分还是初级的,很浅,当然这本书的目的就是学习R语言。在R语言的学习方面,绘图讲的也是一点点。绘图我是结合另一本专门讲lattice的书学习的。

还不错的书

中文写R的书里,算是最好的了,因为本来就没几本。作者避免了过多的数理统计证明,更偏向应用。给出了很多的实例。内容比较简单,生物、经济等学科的学过简单统计学就基本能看了,不过这些读者用SPSS更多吧。当然有数理统计背景阅读起来更轻松。

该书525页

在豆瓣读书里检索本书时,自己大吃一惊——本书25页?想想都不可能!买到手之后才知道是525页,请修改该书的简介~!之前想当然的觉得R会像SPSS,其实它更像SAS,但是比SAS更开放,而且是免费嵌入电脑系统来使用,这是它能渐渐风靡起来的原因吧!

从统计学角度学R和从R角度学统计

从统计学角度学R和从R角度学统计之前粗略的看了下《R语言实战》《R经典实例》等书,更多的是介绍R的命令,给人以很零碎的感觉,看完你基本上只能对R有个大概的认识,很难结合实际来使用它。这本书的好处是,统计的推导,详略得当,太深的略过,中低的都讲明白了,难得的是,一遍看一下,你基本都能明白,为什么要做这样那样的检验,他们的公式是怎样的,对应这样的公式,如果我要用R软件实现,应该如何写代码,基本每个例题的代码,都在R脚本文件中给出了,数据也是直接可以复制或者可以转化后使用的。针对前面提出来的关于其他书籍只是零碎的函数和命令的结合的问题,这本书是解决了的,有丰富的实例,也有相应的代码。还要感谢的一点是,以前一直不知道,如何用向量化的形式,来写和解答各种数学式子,这本书上的很大代码让我有了认识(虽然我掌握的不好)。期待有更多的好书。


 统计建模与R软件下载 精选章节试读


 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024