SAS编程与数据挖掘商业案例

当前位置:首页 > 计算机网络 > 数据库 > SAS编程与数据挖掘商业案例

出版社:机械工业出版社
出版日期:2010-5
ISBN:9787111305354
作者:姚志勇
页数:345页

章节摘录

插图:6.流失在商业领域,流失意味着利润的减少甚至账户关闭,主要发生在电信行业和银行业。由于竞争对手的存在,流失会经常发生。如果能够通过建立一个比较健壮的流失模型,能够对那些可能在未来的几个月内流失的客户做出准确的预测,则从营销角度就可以提前做好一些准备,如通过一些营销手段来挽留这些客户。从技术上,流失模型本质上和风险模型是一样的,只是目标定义可能会有所不同。一种常见的流失定义是:在过去的6个月内账户余额皇现减少趋势,并在第6个月余额低于公司规定的阈值或比例。注意:响应模型是基于时间点的模型,而风险模型和流失模型是基于时间段的模型。7.提升销售和交叉销售提升销售是指预测客户购买更多同样产品的可能性。交叉销售是指预测客户购买公司不同产品的可能性。提升销售和交叉销售对于纵向挖掘一个客户的潜在利润是非常重要的。从技术上来说,关联规则也许能够帮助公司发现客户的特征,著名的“啤酒和尿布”就是多数数据挖掘图书“言必称希腊”的经典案例,但是在作者看来,“啤酒和尿布”如同“尼斯湖怪兽”一样并非值得绝对信赖。在提升和交叉销售领域,更多的关注应该是客户消费对象本身的关联性以及客户的消费心理,这是更偏向于定性分析的技术,而不是定量分析的方法。事实上,以上列举的商业需求只是千千万万个商业需求中的部分代表,读者能够从中得到这样的启发:所有的数据挖掘技术都是商业目标的一个实现,或简单,或复杂。而商业应用的最高原则就是“效率、效果”。13.3.2.编制需求文档在明确了商业目标之后,接下来就需要分析师编制需求文档。需求文档是商业目标的细化。完整的需求文档应包括以下几个部分:项目计划文档(PPT)。方法论设计文档(Word)。变量需求文档(Excel)。这三个项目涵盖了商业客户需求、团队头脑风暴成果、项目数据收集指标三个重要内容。1.项目计划文档项目计划文档是指实现客户需求而制定的需求框架、计划内容、路线图和资源。由于该部分内容主要呈现给商业客户,因此一般以PPT形式,幻灯片尽量控制在10张以下。

前言

当前国内的诸多数据挖掘书籍几乎都是基于理论说明,很少深入介绍数据挖掘实践,涉及SAS开发的更是少见。因此,从商业应用出发,基于实践而不是基于理论的数据挖掘书籍呼之欲出。本书作者从商业需求出发,以商业人士的眼光来看待企业数据挖掘,并给出大量的商业实践案例。把主流的数据挖掘技术用真实案例来实现是本书出版的初衷,同时为了满足初学者需求,作者也给出了数据挖掘必备的基础编程知识模块。全书共分两部分。第一部分是SAS编程:第1章和第2章主要介绍SAS系统和编程基础,同时介绍SAS数据处理最核心的内容——数据指针和PDV流程。该核心内容贯穿第一部分,是已出版的其他SAS图书没有的。第3~9章主要介绍SAS的数据处理技术,也是第一部分的主要内容,包括数据集处理、变量处理和观测处理等多种数据处理技术,同时也介绍了循环控制等稍难的内容,重要的是给出了诸多实际案例及商业应用。尽管第3~9章从表面上看和诸多已经出版的SAS图书没有什么大的不同,但是这些章节最大的亮点是作者对每一个示例和案例从数据指针和PDV流程的角度给予了最详细的程序解读,让读者真正读懂程序,而不是停留在程序的表面。第10章是第一部分r的难点。作者还是站在商业实践的角度逐一介绍宏最常用的部分,同时也给出了非常详细的程序解读。第11章介绍SOL过程。有关内容在国内同类书中都出现过,但是作者独辟蹊径,融合了项目实践中诸多真正有用的语句,同时也给出了诸多开发建议和应注意的问题。第12章介绍数据处理实践。该章共包括四个方面的内容,几乎都是目前国内没有出现过的,如HASH对象及商业应用、正则表达式等。随机抽样也是数据处理经常面临的问题,这里作者开发了在SAS系统中如何处理分层不等比例抽样的代码,这也是目前国内其他SAS图书没有介绍过的。第二部分是数据挖掘商业案例:第13章主要介绍数据挖掘概念和流程。数据挖掘流程尤其是商业流程是本章的重点。该流程告诉读者一个真正的商业数据挖掘流程在商业环境中是如何实施的。第14章重点介绍响应模型。响应模型是商业实践中最常用的预测模型,基于第13章的流程规范给出了一个具体的商业案例研究。第15章是客户行为分析。该章有目前全球最流行的行为分析,包括“行为年龄”和“行为性别”(注意完全不同于具有自然属性特征的“真实年龄”和“真实性别”),作者运用NaiveBayesian技术开发出一整套模型,并对该模型拥有完全自主知识产权。第16章介绍文本挖掘。该章首先介绍了文本挖掘的流程,然后开发出基于NaiveBayesian文本分类算法和EM迭代思想的大型代码,并成功应用于商业实践。

内容概要

姚志勇,南开大学企业管理硕士,进修统计学硕士。现供职于全球500强商业公司,从事SAS数据挖掘工作8年,有丰富的项目实践经验。管理并自主开发多个大型数据挖掘算法源代码,成功应用于商业实践。

书籍目录

出版说明
前言
第1章 SAS系统简介
1.1 系统简介
1.1.1 SAS系统与商务智能系统
1.1.2 SAS系统与其他数据库的数据交换
1.1.3 SAS语言与SAS系统
1.1.4 SAS9浏览窗口简介
1.2 一个简单的编程实例
1.2.1 编写一个SAS程序
1.2.2 提交一个SAS程序
1.2.3 保存和打开一个SAS程序
1.3 DATA步的数据指针和PDV流程
1.3.1 数据指针和PDV流程
1.3.2 DATA步执行次数
第2章 SAS编程基础
2.1 SAS逻辑库
2.1.1 创建SAS逻辑库
2.1.2 删除SAS逻辑库
2.1.3 永久逻辑库和临时逻辑库
2.2 SAS数据集
2.2.1 SAS数据集命名规则
2.2.2 永久SAS数据集和临时SAS数据集
2.2.3 SAS数据集结构
2.2.4 SAS数据集形式
2.3 SAS索引
2.3.1 创建索引
2.3.2 删除索引
2.4 SAS目录
2.5 数据字典
2.6 SAS变量
2.6.1 变量属性
2.6.2 变量列表
2.6.3 自动变量
第3章 数据获取与数据集操作
3.1 数据获取
3.1.1 LIBNAME方式
3.1.2 PASSTHROUGH方式
3.1.3 IMPORT方式
3.1.4 INPUT方式
3.2 SET语句
3.2.1 语法说明
3.2.2 实例详解
3.2.3 商业实践
3.3 BY语句
3.3.1 语法说明
3.3.2 实例详解
3.4 MERGE语句
3.4.1 语法说明
3.4.2 实例详解
3.5 UPDATE语句
3.5.1 语法说明
3.5.2 实例详解
3.6 MODIFY语句
3.6.1 语法说明
3.6.2 实例详解
3.6.3 商业实践
3.7 PUT语句
3.7.1 语法说明
3.7.2 实例详解
3.7.3 商业实践
3.8 FILE语句
3.8.1 语法说明
3.8.2 实例详解
3.8.3 商业实践
3.9 1INFLE语句
3.9.1 语法说明
3.9.2 实例详解
3.9.3 商业实践
第4章 SAS变量操作
4.1 赋值语句和累加语句
4.1.1 赋值语句
4.1.2 累加语句
4.2 KEEP语句和DROP语句
4.2.1 KEEP语句
4.2.2 DROP语句
4.3 IRETAIN语句
4.3.1 语法说明
4.3.2 实例详解
4.3.3 商业实践
4.4 ARRAY语句
4.4.1 语法说明
4.4.2 实例详解
4.4.3 商业实践
4.5 其他语句
4.5.1 RENAME语句
4.5.2 LENGTH语句
4.5.3 LABEI。语句
第5章 SAS观测值操作
5.1 OUTPUT语句
5.1.1 语法说明
5.1.2 实例详解
5.2 子集IF语句
5.2.1 语法说明
5.2.2 实例详解
5.2.3 子集IF与OUTPUT语句比较
5.3 WHERE语句
5.3.1 语法说明
5.3.2 实例详解
5.3.3 子集IF与WIIERE语句比较
5.4 REPLACE语句和REMOVE语句
5.4.1 REPLACE语句
5.4.2 REMOVE语句
5.4.3 REPLACE、REM0vE与OUTPUT应用
5.5 DELETE语句与STOP语句
5.5.1 DELETE语句
5.5.2 STOP语句
第6章 SAS数据集管理
6.1 APPEND过程
6.1.1 语法说明
6.1.2 实例详解
6.2 SORT过程
6.2.1 语法说明
6.2.2 实例详解
6.2.3 商业实践
6.3 TRANSPOSE过程
6.3.1 语法说明
6.3.2 实例详解
6.4 CONTENTS过程
6.4.1 语法说明
6.4.2 实例详解
6.5 DATASETS过程
6.5.1 语法说明
6.5.2 实例详解
第7章 DAIA步循环与控制
7.1 IF.THEN/ELSE语句与SELECT语句
7.1.1 lF.THEN/ELSE语句
7.1.2 SELECT语句
7.2 DO语句
7.2.1 D0组语句
7.2.2 D0循环语句
7.2.3 DOWHILE语句
7.2.4 DOUNTIL语句
7.2.5 DOOVER语句
7.2.6 商业实践
7.3 各种控制语句
7.3.1 GOT0语句
7.3.2 CONTINUE语句与LEAVE语句
7.3.3 RETIJRN语句
第8章 常用全程语句
8.1 COMMENT语句
8.2 X语句
8.3 FILENAME语句
8.4 %INCLUDE语句
8.5 TITLE语句
8.6 FOOTNOTE语句
第9章 输出控制
9.1 LOG窗口输出控制
9.2 OUTPUT窗口输出控制
9.3 常用ODS输出控制
9.3.1 ODSLISTING
9.3.2 ODSRESUTS
9.3.3 ODSTRACE
9.3.4 ODS0UTPUT
9.3.5 ODSHTML
9.3.6 ODSCSVALL
9.3.7 ODSSELECT
9.3.8 ODSEXCLUDE
第10章 SAS宏变量
10.1 宏运行的内在机制
10.2 宏变量
10.2.1 定义宏变量
10.2.2 显示宏变量
10.2.3 引用宏变量
10.3 宏程序
10.3.1 定义宏
10.3.2 调用宏
10.3.3 宏内宏
10.3.4 宏存储
10.4 宏参数
10.4.1 创建参数
10.4.2 参数赋值
10.5 宏函数
10.5.1 通配函数
10.5.2 计算函数
10.5.3 字符函数
10.5.4 引用函数
10.6 宏语句
10.6.1 %IF.%TIIEN/%ELSE语句
10.6.2 %DO组语句
10.6.3 %DO循环语句
10.6.4 %DO%WHILE循环语句
10.6.5 %D0%UNTIL循环语句
10.7 宏应用
10.7.1 创建宏变量的八种方法
10.7.2 宏程序一般应用
10.7.3 宏程序高级应用
第11章 SQL过程
11.1 单表操作
11.2 多表操作
11.2.1 多表关联
11.2.2 子查询
11.2.3 合并查询
11.2.4 MERGE与SQL比较
11.3 创建、更新与删除表操作
11.3.1 创建表
11.3.2 行操作
11.3.3 列操作
11.3.4.删除表
11.4 使用SQL注意的几个问题
第12章 数据处理实践
12.1 随机抽样
12.1.1 简单无重复随机抽样
12.1.2 分层等比例随机抽样
12.1.3 分层不等比例随机抽样
12.1.4 随机抽样MACRO
12.2 HASH对象
12.2.1 HASH对象的引例
12.2.2 HASH对象的语法
12.2.3 HITER对象的引例
12.2.4 HITER对象的语法
12.2.5 商业实践
12.3 FORMAT综述
12.3.1 PROC步创建
12.3.2 DATA步创建
12.3.3 永久存储及调用
12.4 正则表达式
12.4.1 语法说明
12.4.2 常用函数
12.4.3 实例详解
12.5 宏在SAS与Excel转换中的应用
12.5.1 SAS数据集转换成Excel
12.5.2 Excel转换成SAS数据集
第13章 数据挖掘概念、任务和流程
13.1 数据挖掘概念
13.2 数据挖掘任务
13.3 数据挖掘流程
13.3.1 定义商业目标
13.3.2 编制需求文档
13.3.3 选择数据源
13.3.4 建模流程图
13.4 LOGISTIC建模及结果详解
13.4.1 数学模型
13.4.2 参数估计
13.4.3 模型评价指标
13.4.4 回归系数
13.4.5 变量筛选方法
13.4.6 应用举例及输出结果详解
13.4.7 多值LOGISTIC模型
第14章 响应模型:定位新客户
14.1 前期准备
14.1.1 商业需求
14.1.2 定义目标
14.1.3 选择变量
14.2 数据获取与数据处理
14.2.1 创建建模数据集
14.2.2 变量首次筛选
14.2.3 数据探索
14.2.4 数据清洗
14.2.5 变量二次筛选
14.2.6 变量三次筛选
14.2.7 字符变量压缩
14.3 模型开发
14.3.1 全模型法选择所有候选模型
14.3.2 逐步回归法筛选候选模型
14.3.3 创建两个重要数据集
14.3.4 创建LIFT图
14.3.5 创建评分卡文件
14.4 模型验证
14.4.1 评分卡文件导入
14.4.2 LIFT图比较
14.4.3 模型确认
14.5 模型实施与监控
14.5.1 模型实施
14.5.2 模型监控
14.6 小结
第15章 行为建模:客户行为属性分析
15.1 前期准备
15.1.1 商业需求
15.1.2 定义目标
15.1.3 选择建模方法
15.2 数据获取与处理
15.3 模型开发
15.4 模型验证
15.5 模型打分
15.6 模型预测
15.7 模型实施
15.8 小结
第16章 文本挖掘:Web文本分析
16.1 文本挖掘概念与流程
16.1.1 文本挖掘概念
16.1.2 文本挖掘流程
16.2 商业案例
16.2.1 商业需求
16.2.2 建模框架设计
16.2.3 结合朴素贝叶斯文本分类的EM迭代
16.2.4 数据获取与数据预处理
……
参考文献

作者简介

《SAS编程与数据挖掘商业案例》是作者多年来在企业实践工作中的经验总结,详细讲解了使用SAS进行商业数据挖掘的方法。其中包含了目前公开出版的诸多SAS教材没有的大量实战内容。《SAS编程与数据挖掘商业案例》内容全面、新颖独创、综合性强,适合企业人员使用,也可作为数学、统计学、金融、电子商务、医药等专业的本科生、硕士生学习SAS编程和数据挖掘的参考资料。

图书封面


 SAS编程与数据挖掘商业案例下载 更多精彩书评



发布书评

 
 


精彩书评 (总计4条)

  •     这本书2013年6月6号买的,11月24号才看完,拖拖拉拉看了这么久,也真是不容易。这本书的章节段落安排还不错,里面的一些内容也由浅入深,从基础的Data Step,Proc Step到最后的Data Mining,涵盖范围很广泛,对我自己来讲,基础知识差不多了,这本书让我从一个菜鸟走向了一个老鸟的道路,后面的数据挖掘还没有看基本,因为说实话现在还没有接触到这些东西,看也印象不够深刻,等到自己了解一下大数据,然后在向modeling team学习学习再看看这些应该会好很多。总而言之,从这本书上也学到了很多东西,让我对于一些基础的概念以及使用方法有了更加深刻的认识,但是书中有的例子的解释有些一带而过,对于读者得到的信息假设过高,希望以后可以改进。路漫漫其修远兮,学习之路无尽头,共勉。
  •     作者号称是从PDV角度详解sas程序运行机制,以示与其他SAS的不同。遗憾的是,作者在书中并未详细介绍PDV到底为何物,就连书中提到的数据指针也为详细说明,并且很容易让读者混淆数据指针和PDV。事实上,作者在书中的表述也很含糊,一会让人感觉这是pdv,一会让人感觉这应该是数据指针。或许作者已经混迹SAS界多年,觉得这等小儿科问题应该是一看就懂的,然而遗憾的是,很多读者都是新手,它们不懂,故想象力也有限。
  •     说完了书的缺点,再来说说书的优点。前面说入门读起来应该比较吃力,不过不可否认,该书写的的确有特色。其一,把SAS与数据挖掘结合起来,这样的书在国内还不多见,因此,从某种意义上说,该书具有一定的里程碑意义;其二,该书内容包含丰富,基本上涵盖了SAS基础的编程知识,如果读者能读懂,想必收获一定不小。

精彩短评 (总计101条)

  •     是一本实用的教程,还需要学习
  •     刚看了前几页,讲的东西很基础,适合SAS初学者循序渐进
  •     相当不错,适合于初学!
  •     数据挖掘案例虽然讲的不是很详细,但整个流程交代的很清晰,入行后再看
  •     不适合入门读者。
  •     这本书相对其他的书来说比较适合入门的小白。。。。
  •     这本书在网上看到评论才买的,有很多案例,所以也从中学到了一些东西。
  •     如题,确实是本正版好书。和一般的SAS书不同,有很多原创的东西。不过建议刚开始学SAS的童鞋们,英语好的多看看帮助,英语不好的再买一本SAS语法介绍的书来参考,这样会比较容易懂。
  •     内容丰富,案例针对性强,书中模型值得举一反三地应用。
  •     书中内容太浅显,讲解不深入。
  •     非常好的书,作者很用心,市场中充斥着粗制滥造的SAS书,这一本是少有的例外
  •     必须称赞姚先生第一个理想实现得很完美
  •     还不错,讲解的比较透彻,入门~
  •     很适合现在看。够看着一阵子了
  •     一本实用案例书籍,适合初学者实用
    内容比较实在,没有冗余
  •     数据分配与挖掘的经典书籍
  •     很基础,值得看
  •     只看了文本挖掘部分。。。
  •     两字---经典!!
  •     这书是正版的 而且很适合SAS初学者
  •     还行,包装不错
  •     一般般,还行吧。
  •     对SAS编程的讲解比较详细,结合实例和代码解读数据挖掘方法
  •     N多同事推荐的一本关于SAS的书,脚踏实地的方法语言。真的值得一读。
  •     数还不错,深入浅出~
  •     感觉当当东西还是可以,方便
  •     代码讲解的很细,给我不少启发
  •     书的质量很好,内容写得也不错。
  •     很经典,里面讲了很多小技巧
  •     比较结合实际应用,可以再结合其他书一起看
  •     这本书很不错,看后会有“原来如此”的感觉。
  •     讲解细致,需要有一定基础
  •     本书是人大论坛上的经典,我们统计学必备啊,哈哈
  •     很适合一无所有者使用
  •     好,果然强大,是我想要的。
  •     确实是本SAS好教材!
  •     不好意思,年前书就到手了,由于时间问题没有及时写评论,发货速度快,服务态度好,书还没有顾上看,给好评。
  •     总体还算不错的,可是对新手有点难
  •     跟风买的
  •     吃饭的东东
  •     一直在当当网上买书,包装什么的偶很好~这本书还没看,呵呵~
  •     非常哦, 内容比较详细
  •     这本书我喜欢,一定好好看的,相信我
  •     书很好,可惜的是我还没静下心来好好读
  •     书很不错,讲的挺仔细。网上还可以下载到书中的代码。就是书里面会有一些错误。
  •     很不错的书,想学BI或数据分析的,应该看
  •     没有基础的人还是不要看,有基础的看看比较好
  •     书挺好的,质量、速度方面都很满意!!
  •     内容非常不错,对学习很有帮助
  •     适合初中级读者。中级读者最好的sas book。
  •     非常好的一本学习SAS的工具书,程序很详细,案例也很实用~
  •     对学SAS的人来说确实是不可多得的好书
  •     是一本能让人看下去的书,非常不错
  •     很适合我这初学者
  •     内容对我来说太深了,看来自已还要努力学习哦
  •     书讲的很详细,不错
  •     比朱的那本深入到SAS机制
  •     本书无论从SAS BASE的理论和应用层面,内容都很实在和实用,值得实践中反复体会。
  •     比较基础的工具书
  •     好书,抛砖引玉!
  •     书到了 时间挺快的 以前有看过这本书 觉得还不错
  •     学sas就看这本书 还有朱世武的就行
    最喜欢论坛里大牛出的书了
  •     书的质量还是很不错的,很满意,但内容还没有去看完,不能提供有价值的信息。
  •     好好好好好得得得得得
  •     书的前言部分有印刷错误
  •     书都很正的,特别开心,物流也顺
  •     还不错啊 比较满意
  •     很好 不错 但是感觉 要有一定的基础
  •     据说代码是直接从我行拷出去的?
  •     适合新手 例子不错 适合自己研究
  •     虽然只看了开头,但是比较喜欢。希望自己好好学习一下。
  •     难易都有 适合有一定基础的人学习
  •     非常好的一本sas的讲解书,适合有数据库SQL基础的人来读或者当工具书,从书中可以看出,作者的实践经验很足,讲的点很到位,有种恍然大悟的感觉。没买错
  •     关于sas使用的很好的引导资料
  •     还没开始看,编排结构很好,应该不错。
  •     不适合入门SAS。 理论部分:语言不准确,口头化,不易理解。 例子:前面知识点的例子中包含很多后面章节的知识点,让人摸不着头脑,打击学习积极性。 作者也许是一个sas专家,但不是一个好的作者。
  •     很不错的书籍,帮同学买的,他很满意。
  •     理论结合实例,对初学者而言是非常好的启蒙书.
  •     对每一个语句都有语法说明和实例详解,相当清晰。还有一些商业实践的说明,用于加深对基础知识的理解。总之,这本书适合初学SAS编程的读者。
  •     看起来好难~用心看看再说
  •     此书整体上有比较好的编程和SAS代码参考作用。
  •     总体来说不错,条理比较清晰,解释清楚
  •     书很不错,配送太慢了
  •     人大经济论坛sas板块版主的实力作!!!!!
  •     书刚看 网上评价都很高
  •     编程内容不错,书看上去编排不错
  •     好书,必须要有一定sas基础才能领悟作者的意图
  •     不错的一本书,看的书作者是有深厚功底的,就是感觉作者写书时有些着急,仿佛一下子就想把所有知识点都提到。
  •     整体外形有点变形,看上去不顺,内容还是不错的,挺详细
  •     书中的案例数据完全采用的是商业实战数据,贴近于企业数据挖掘的实务操作,而且书中总结了在实务操作中的一些小技巧、比较了程序的优化算法、proc sql的常见应用,书的后面3章专门完整地介绍了3个商业数据挖掘的案例,是很实用也很突出重点的一本书,很棒~
  •     国内对应的书籍较少,慢慢研究。期待有收获
  •     现在看还是有点偏简单了
  •     非常棒的一本书~
  •     书本质量还行,但快递大叔态度实在不敢恭维
  •     《SAS编程与数据挖掘商业案例》这本书对于有sas及数据分析理论基础,而没有实践经验的新人来说,特别有学习价值,有案例,有思路,特别好的一本书。
  •     越来越感觉到当当的服务好,昨天收到书,发现邮寄包装很好,把书保护得很好。
  •     慢慢学习慢慢看
  •     很好很详细的介绍
  •     学习SAS的经典书籍,不过没找到我迫切需要的章节
  •     这本书还不错,例子多对于初学SAS的人来说还是非常有益的
  •     书的内容较难,最好有一定的编程基础
 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024