《谁说菜鸟不会数据分析(工具篇)》章节试读

出版社:电子工业出版社
出版日期:2013-6-1
ISBN:9787121204098
作者:张文霖,狄松,林凤琼 等
页数:228页

《谁说菜鸟不会数据分析(工具篇)》的笔记-第71页 - 第2章 玩转数据分析

《谁说菜鸟不会数据分析工具篇》PowerPivot
PowerPivot是微软在Excel2010中新增的一个插件工具。在PowerPivot中,Excel的行、列限制已被取消,这样我们能方便地操作更大型的数据。
一、导入TXT数据源;
二、创建数据透视表(What);
三、多表关联分析(Who);
四、字段计算分析,包括简单计算和函数计算,MONTH函数语法为:MONTH(<date>),其中date是提供对包含日期的列的引用或者通过使用返回日期的表达式。
五、数据分组分析。数值分析,采用IF函数:
=IF(‘用户明细’[年龄]<=20,”20岁及其以下”,IF(‘用户明细’[年龄]<=30,”21-30岁”,IF(‘用户明细’[年龄]<=40,”31-40岁”,”40岁以上”)))
日期/时间分组:PowerPivot中用,函数
=FORMET(‘用户明细’[注册日期],”D”)

《谁说菜鸟不会数据分析(工具篇)》的笔记-第130页 - 第3章 show出你的数据

《谁说菜鸟不会数据分析工具篇》水晶易表
水晶易表是一个非常优秀的数据可视化工具,能够把静态的Excel模型转变成生动的数据可视化展示。Step1:先对可视化模型有一个初步的构思与设计,确定好基本框架结构。
Step2:建立Excel模型。包括原始数据区,数据交互区和数据结果区。
Step3:将Excel模型导入可视化模型,并进行相对应部件的设置连接,通过可视化模型展现出Excel模型结果。具体又包括5个步骤,导入Excel模型、设置电子表格选择器部件、设置折线图部件、设置量表部件、设置标题。Step4:完成可视化模型制作,导出为仪表盘文件。导出文件类型包括了3种常用的格式:ppt、word、pdf。

《谁说菜鸟不会数据分析(工具篇)》的笔记-第200页 - PPT报告自动化

PPT报告自动化原理与Excel日报自动化原理类似,只是在最后一步有所不同,就像你说的,需要把通报正文与对应图表这些内容自动搬到PPT报告每页的对应位置。
下面是PPT自动化原理:
1、通过VBA语句,从数据库自动提取指定月份的关键指标数据,并自动追加放置在一张名为“数据源”表的相应位置,实现一键自动提取数据。
2、在数据转化区中,根据现有月份数据自动计算出月份,根据月数动态引用“数据源”表中相应的数据,并自动进行数据整理,通报文字的组合。
3.通过VBA语句,将图表数据去除公式,只把数据值复制到PPT报告相应的图表数据源中,以实现PPT图表数据的更新,并将通报文字进行相应替换。

《谁说菜鸟不会数据分析(工具篇)》的笔记-第250页 - VBA

谁说菜鸟不会数据分析工具篇 VBA
VBA(Visual Basic For Application)是一种通用的自动化语言,它可以使Excel中常用的操作步骤自动化,还可以创建自定义的解决方案。
在Excel中使用VBA有以下几个优点:
1、使固定、重复的任务程序自动化,提高工作效率;
2、可进行复杂的数据处理和分析;
3、可自定义Excel函数、工具栏、菜单和界面;
4、可连接到多种数据库,并进行相应数据库操作。
从录制宏开始:简单来说宏就是一段VBA语句的集合,VBA语句以宏的方式存放在Excel中,供我们调用运行。需要注意的是,宏绝不等于VBA,它只是VBA最简单的运用。
宏可以通过编写VBA语句、录制宏两中方式获得。通常采用的方式是先录制宏,然后在完成录制宏的基础上进行语句优化调整,得到所要的宏。
一段VBA语句以Sub开始,以End Sub结束,Sub过程中间夹杂着实现功能的VBA语句。每条VBA语句代表一个功能。对象和属性中间用小圆点分隔开,小圆点相当于中文语句中的“的”,表示隶属关系,即某个属性属于某个具体的对象。VBA语句执行时就从第一句Sub开始逐条执行,直到Enb Sub结束。
VBA调试技巧:
1、利用F8键,可分步运行VBA语句,并能够快速定位出无法运行或运行结果错误的VBA语句。
2、立即窗口可通过CTRL+G打开,在该窗口里可显示Debug.Print语句的结果值,以及随时计算和运行代码。
3、编辑窗口,将鼠标停在编辑窗口的变量上可显示该变量的值。

《谁说菜鸟不会数据分析(工具篇)》的笔记-第111页 - 玩转数据分析

《谁说菜鸟不会数据分析(工具篇)》的笔记-第43页 - 第一章 高效处理千万数据

分组、重复数据处理和统计
数据分组:IIF函数法:
IIF(表达式,表达式成立时返回的值,表达式不成立时返回的值)
CHOOSE函数法:
CHOOSE(参数,结果1,结果2,……,结果N)
SWITCH函数法:
SWITCH(条件1,结果1,条件2,结果2,……,条件N,结果N)
PARTITION函数法:
PARTITION(数值参数,开始值,结束值,组距)
日期/时间分组,使用FORMAT函数:
FORMAT(日期/时间,日期/时间格式参数)

重复数据处理
重复项查询SQL方法;
SELECT First(用户ID),Count(用户ID) AS NumberOfDups
FROM 订购明细
GROUP BY 用户ID
HAVING Count(用户名)>1;
将上面函数最后一句 > 改成 = ,就变成不重复项查询。

数据统计
简单统计:
Count()统计指定列中值的个数
Sum() 计算数值型数据的总和
Avg() 计算数值型数据的平均值
Max() 筛选出数据的最大值
Min() 筛选出数据的最小值
Stdev() 计算数值型数据的标准差
Var() 计算数值型数据的方差
另外还有分组统计和交叉表统计方法

《谁说菜鸟不会数据分析(工具篇)》的笔记-第16页 - 高效处理千万数据

最近工作中需要经常做图表,做市场调研数据分析,索性买了一本《谁说菜鸟不会数据分析工具篇》来学,看了下这本书,讲的都比较简单易懂,适合我这种上班没太多时间学的人,看着彩图学就是爽。将学习心得记下来,督促学习。
这本书是基于最常用的Excel,用Excel做各种图表的数据分析处理,还包含了很多和Excel紧密相关的工具,做数据处理的(Microsoft Access、Query)、数据分析(PowerPivot)、数据呈现(水晶易表)和报告自动化(VBA)。
一些常用的插件工具,可以在http://www.dozan.cn或http://blog.sina.com.cn/xiaowenzi22下载.
Access数据库,是Microsoft Office办公软件中一个极为重要的组成部分,不仅能存储数据,还能对数据进行处理分析。Access 2010用到的主要对象是表和查询。数据表是数据库中存储数据的唯一单位,数据库将各种信息分门别类地存放在各种数据表中;查询是根据指定条件将表中的数据筛选出来,并以表的形式返回筛选结果。
SQL是结构化查询语言,弥补Access查询菜单的不足,也用于数据挖掘。
SQL查询语法,SELECT语句:
SELECT字段1,字段2,字段3……
FROM表
WHERE条件 (多个条件用and)
注意参数为字符型时用单引号,语句结束处添加句号。
导入TXT数据,可以直接导入法,将txt文件直接导入进Access数据库中,Access数据库中的表与数据源没关系了,数据更改不会影响源文件。也可以建立链接法,这样对原文本文件的任何更改都将自动反映到链接表中,好处是数据会随着数据源的变化而自动更新。

《谁说菜鸟不会数据分析(工具篇)》的笔记-第27页 - 第一章 高效处理千万数据

数据合并可以横向合并和纵向合并
横向合并:
从多个表中,根据共有的关键字段来合并。菜单操作法,使用数据库工具选项卡->关系组中关按钮系。要注意的是2个表按关键字段合并有3中方式,一是只包含两个表中联接字段相等的行(内连接),二是包括表1中所有记录和表2中联接字段相等的那些记录(左连接),三是包括表2中所有记录和表1中联接字段相等的那些记录(右连接)。
SQL查询方法,数据库右下角SQL按钮可将命令转换成SQL语句。举个例子
SELECT B.用户ID, B.产品 A.性别
FROM 用户明细AS A,订购明细AS B
WHERE A.用户ID = B.用户ID;
纵向合并:
简单理解就是比如每天一个表,将多天的表合并在一起。用追击查询功能实现,手动的将表一个一个的加在一起,表多的时候就要用到SQL。更简单是方法是用UNION或UNION ALL。UNION ALL就是将各表的记录合并到一起,并且对这些记录不做任何更改,而UNION会删除各表存在的重复记录,并自动排序。
在Access数据库中进行数据计算。简单计算方法利用查询设计来完成。同样的,用SQL直接写出运算表达式即可。运用Access数据库中自带的函数也能有效的完成数据计算。

《谁说菜鸟不会数据分析(工具篇)》的笔记-第15页

这个升级版工具篇好像实用点
Excel的局限性适应不了大数据时代,需要数据库来处理。

《谁说菜鸟不会数据分析(工具篇)》的笔记-第91页 - 第二章 数据分析工具库

《谁说菜鸟不会数据分析工具篇》Excel数据分析工具库
为了方面进行数据统计分析,Excel提供了一个数据分析加载工具-分析工具库。
一、描述性统计分析,常用指标主要有平均数、方差、中位数、众数、标准差、方差等,提供分析对象数据的集中程度和离散程度等信息
二、直方图,若勾选【帕拉图】,则可以在输出表中同时显示按降序排列的频率数据;如未勾选。则Excel将只输出按默认组距排列的频率数据。帕拉图与直方图的区别就是横坐标是否排序,
三、抽样分析,使用Excel抽样分析工具,既可以实现随机抽取数据,也可以实现周期性间隔抽取数据。
四、相关分析,这个需要用到Excel分析工具库-“相关系数”分析工具。
五、回归分析。简单线性回归模型为:Y=a+bX+
式中,Y-因变量
X-自变量
a-常数项,是回归直线在纵坐标轴上的截距
b-回归系数,是回归直线的斜率
-随机误差,即随机因素对因变量所产生的影响
接着绘制散点图,生成回归统计表、方差统计表和回归系数表。
六、移动平均。根据时间发展进行预测,简单来说就是时间序列预测,常用方法有移动平均法和指数平滑法。
移动平均法根据时间推移依次计算包含一定期数的平均值,形成平均值时间序列,适合短期预测。
七、指数平滑,是一种改良的加权平均法,根据本期的实际值和预测值,并借助于平滑系数进行加权平均计算,预测下一期的值。


 谁说菜鸟不会数据分析(工具篇)下载 更多精彩书评


 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024