数据挖掘技术

当前位置:首页 > 计算机网络 > 研究生/本科/专科教材 > 数据挖掘技术

出版社:机械工业
出版日期:2006-7
ISBN:9787111190561
作者:[美]MichaelJ.A.B
页数:410页

内容概要

Michael J.A.Berry,他们是专业的数据挖掘咨询公司Data Miners的创办人。他们合作出版了一些经典的数据挖掘著作,包括Data Mining Techniquee,Mastering Data Mining和Mining the Web(均由Wiley公司出版)。作为数据挖掘顾问,他们一起为北美洲、欧洲和亚洲的许多大公司提供专业咨询,把客户数据、呼叫数据、网络日志条目、销售点记录和账单文件变成有用的信息,用于改善客户体验。他们都有近20年在营销和客户关系管理方面应用数据挖掘技术的经验。

书籍目录

出版者的话
专家指导委员
译者序
致谢
前言
第1章 数据挖掘的缘起和内容
1.1 分析客户关系管理系统
1.2 什么是数据挖掘
1.3 数据挖掘可以完成哪些工作
1.4 为什么现在研究
1.5 目前如何使用数据挖掘
1.6 小结
第2章 数据挖掘的良性循环
2.1 商业数据挖掘案例研究
2.2 何谓良性循环
2.3 良性循环环境下的数据挖掘
2.4 移动通信公司建立恰当的联系
2.5 神经网络和决策树驱动SUV的销售
2.6 小结
第3章 数据挖掘方法论和最佳实践
3.1 为什么需要方法论
3.2 假设测试
3.3 模型、建立简档和预测
3.4 方法论
3.5 小结
第4章 数据挖掘在市场营销和客户关系管理中的应用
……
第5章 统计学的魅力:数据挖掘常用的工具
第6章 决策树
第7章 人工神经网络
第8章 最近邻方法:基于存储的推理和协同过滤
第9章 购物篮分析和关联规则
第10章 链接分析
第11章 自动聚类探测
第12章 市场营销中的风险函数和生存分析
第13章 遗传算法
第14章 数据挖掘贯穿客户生存周期
第15章 数据仓库、OLAP和数据挖掘
第16章 构造数据挖掘环境
第17章 为挖掘准备数据
第18章 应用数据挖掘

作者简介

本书是数据挖掘领域的经典著作,数年来畅销不衰。全书从技术和应用两个方面,全面、系统地介绍了数据挖掘的商业环境、数据挖掘技术及其在商业环境中的应用。自从1997年本书第1版出版以来,数据挖掘界发生了巨大的变化,其中的大部分核心算法仍然保持不变,但是算法嵌入的软件、应用算法的数据库以及用于解决的商业问题都有所演进。第2版展示如何利用基本的数据挖掘方法和技术,解决常见的商业问题。
本书涵盖核心的数据挖掘技术,包括:决策树、神经网络、协同过滤、关联规则、链接分析、聚类和生存分析等。此外,还提供了数据挖掘最佳实践、数据挖掘的最新进展和一些富有挑战性的研究课题,极具技术深度与广度。配套网站www.data-miners.com/companion提供了每章的练习和用于测试各种数据挖掘技术的数据。全书语句凝炼、清新,对复杂概念的实际应用进行了生动解释,是必不可少的数据挖掘教材。

图书封面


 数据挖掘技术下载 更多精彩书评



发布书评

 
 


精彩书评 (总计2条)

  •     1.分类/预测:决策树算法面向有规则问题时的有效方法,能发现数据中淹没的潜规则。对于分类记录或预测离散结果,决策树是首选。同时,决策树比其他技术需要的数据准备更少,几乎在每个数据挖掘工程中都会被用到。尽管建树的算法有多种变体,建成的树的形态与效率也有差别,但具有相同的基本过程,即相对于目标变量而言,每一新生节点比其原生节点有更好的纯度。只要达到这个目标,多次迭代后总会得到对数据集的一个划分。最佳拆分方式的度量:降低发散性,提高纯度。目前的纯度度量有基尼、熵、信息增益率和卡方等。使用基尼准则建立的树更倾向于产生两个纯度都较高的子节点的拆分,而不是一个更纯的加上一个大而不是很纯的子节点的拆分。熵准则更倾向于纯度,即时得到的节点很小。因此熵准则适合于确有清晰的潜在规则的领域,对市场营销这类模糊领域,会导致不稳定的树。决策树的年轮图是很酷的表示方法,能够应用在商业环境中。2.预测/分类/聚类:人工神经网络训练网络的过程实际上是内部调整权重的过程过拟合:在验证集上,较早几代往往比最终网络更好前馈网络中要明确的核心问题:激活函数是什么、网络拓扑、反向传播是什么隐藏层越宽,识别模式的能力越强。副作用是网络可能会记住某一种模式,我们需要网络从训练集中总结,而不是记住模式。反向传播网络的最优化算法:爬山和模拟退火。危险在于陷入局部最优神经网络是不透明的,我们无法了解他如何工作,灵敏度分析可以帮助我们观测这个网络(很有意思)3.推荐与推理:最近邻(协同过滤)这种算法是一种MBR(Memory-based reasoning),它能够适应不断加入的新数据,但同时也是数据贪婪者,需要大量历史数据4.关联规则三个判定规则:置信度、提升度和否定规则5.链接分析:就是图论,欧拉图和哈密顿图的应用。Pagerank应该放在这部分,不过书中没讲。6.自动聚类:k均值和GMM7.市场营销中的风险函数和生存分析客户行为的重要指标:保有期tenure,客户曾经多久为我们提供了很多信息。客户半衰期:用衰变曲线解读客户。风险的定义:假设用户已经保有t时间,其在t+1之前离开的概率常用模型:浴缸型函数8.遗传算法:通过进化实现最优化的强力技术,显然可以用来训练神经网络。进化功能的关键参数:基因组、适应度函数9.一个数据挖掘团队需要的知识体系RDBMS技能(SQL)工具与编程(SAS、SPSS...)统计学机器学习技能行业知识数据可视化技能访问及需求收集技能展示、写作与沟通
  •     这本书是机械工业出版社的“计算机科学丛书”系列的,总体上翻译的不错,很通顺。内容上,围绕着市场营销、销售MARKETING与客户关系管理CRM的内容,比较紧凑。方法上围绕着DM的经典算法进行介绍。介绍的时候偏重于对方法的特点,对应解决问题的实例,方法运行的结果的展示。对于DM如何解决问题给了很好的启示。对于算法的原理方面有涉及,但是不多,具体算法还是看专门的书籍吧。对这本书感触最深的是作者内容安排的深邃与文笔写作间的从容。作者为了讲解DM的方法,还铺垫统计学的一些基础知识和典故。比如5.1节讲到Occam的剃刀时,专门讲了这个圣芳济会的修道士的故事,还会自问自答地问道“William of Occam与数据挖掘有什么关系呢?”做一番铺垫再讲null hypothesis与p-value的概念。再比如,6.3.7一节讲F检验的时候,就提到这个准则的命名是从Ronald.A.Fisher而来,顺便提一下Fisher与Pearson大部分重叠的兴趣与从无不往来的私交。点点滴滴为阅读的过程增加了些许乐趣。这本书对于算法的编码实现或者软件操作介绍的不多,几乎没有。但是对于操作过程的涉及的概念都有详细介绍,如6.3.5一节通过一个实例计算出“使用GINI准则建立的树将更倾向于产生两个几乎很纯的子节点的拆分,而不是产生一个完全纯的子节点加上一个更大但不很纯的子节点拆分”&“与GINI得分相比,熵准则对埂春的节点确实有更强的倾向”。再比如6.8.2对于SAS Enterprise Miner给出的树年轮的示意进行了讲解。这本书不是纯讲技术的书,但是其对技术的理解很有帮助。特别欣赏这本书在开篇中给出的数据挖掘的广义定义:“数据挖掘是一种态度,它表明商业活动应该基于认知,分析获得的决策比没有任何分析所得的决策好得多,经过测算的结算更利于商业盈利。”一种谨慎的认知的态度~

精彩短评 (总计34条)

  •     应该说,这是一本介绍性的书,了解相关实现后再回头看看这本书可能会有点意思,这书简单地介绍了常见的几种数据挖掘方式的优缺点。
  •     不错的工具书,简单易懂,将数学和统计推演降到最低限度。适合数据挖掘入门者阅读。
  •     未读完
  •     为什么没有“调查分析师”证书考试用的书,我想买中级考试的书,但也要看价格
  •     总体来看,这本书还是很不错的。对数据挖掘的技术介绍得很全面。翻译的质量尚可,只是限于东西方人的思维差异,读起来还是有一些晦涩。本书对具备一定数据处理分析经验的人,有很大的启发性。
  •     通过学习本书,读者不仅可以精通数据挖掘的整体结构和核心技术,还可以领略数据挖掘在销售和客户关系管理等方面的成功应用,为实践数据挖掘打下坚实的基础。
  •     hghjhj
  •     扫盲用书籍,开阔视野~
  •     这本书对数据挖掘技术诠释的很全面,值得大家看
  •     :TP311.13/277
  •     一个数据挖掘团队需要的知识体系:   RDBMS技能(SQL);   工具与编程(SAS、SPSS);   统计学 ;   机器学习技能;   行业知识;   数据可视化技能;   访问及需求收集技能;   展示、写作与沟通。
  •     很不错的一本书,涉及许多统计学的原理.如果翻译功力能够再好一点就更好了.
  •     非常实用的一本书。
  •     也许工作后会用到吧!
  •     不错的一本书,特别是涉及CRM方面的应用,在看完基础算法以后看看这类书是很有好处的
  •     写的比较简单,偏重方法论部分,简单介绍了部分算法...举的例子也很直观
  •     应该是数据挖掘的经典之作了,内容很广泛全面,适合初学者。但是,细节讲解得不够,看起来案例很多,但是都无法直接应用。
  •     曾一度做这行,想一直做下去。
  •     老师让我们选的这本书我们就选咯里面还算通俗易懂现在数据挖掘技术在国内还不是很成熟
  •     测试
  •     我觉得这是入门级书籍中的好孩子,因为把该说的细节说清楚了,而且有案例实例和数据实例。题目虽然给人只讲市场应用的印象,但实际作者通过市场,生物,地产,医学等等大量例子讲了基本规律。亮点是人工神经网络那章,这是我见到的书中讲得最详细的。
  •     不理解,很深奥、
  •     不是很系统,从案例的角度来说还可以,废话有点多,唉
  •     总体不错
  •     看书名,本想补充一下数据挖掘的业务应用,但为什么本来懂的一些概念,看得越发模糊了。不用公式来说明这些数学原理,真是唉。。。然后很少说外文说翻译问题的,但这本有些句子怎么看着为什么那么不适应。
  •     第一遍。。。
  •     数据挖掘的启蒙教材,重在教你怎么应用数据挖掘技术。
  •     数据挖掘是门高深的学问,不是一本书就能明白的但是个人觉得这本书翻译的有些晦涩.
  •     针对商学院和经管学院的数据挖掘研究和学习十分有用,建议相关领域同学人手一本,华章这套书还是很不错的
  •     这本不是范某某翻译的,果然好多了。其实数据挖掘导论的内容也比较实在,就是翻译让人实在地焦灼....
  •     课本就是容易让人烦躁 我更喜欢工具书
  •     深浅适中,重心清晰
  •     内容比较适合从事商业的人员学习.
  •     只是翻译稍有不足,很多实际例子,讲解详细,容易明白,比国内人写的书要好很多。
 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024