数据挖掘导论

出版社:人民邮电出版社
出版日期:2010-12-10
ISBN:9787115241009
作者:Pang-Ning Tan,Michael Steinbach,Vipin Kumar
页数:463页

章节摘录

插图：空间数据的重要例子是科学和工程数据集，其数据取自二维或三维网格上规则或不规则分布的点上的测量或模型输出。例如，地球科学数据集记录在各种分辨率（如每度）下经纬度球面网格点（网格单元）上测量的温度和气压（见图2-4d）。另一个例子，在瓦斯气流模拟中，可以针对模拟中的每个网格点记录流速和方向。5.处理非记录数据大部分数据挖掘算法都是为记录数据或其变体（如事务数据和数据矩阵）设计的。通过从数据对象中提取特征，并使用这些特征创建对应于每个对象的记录，针对记录数据的技术也可以用于非记录数据。考虑前面介绍的化学结构数据。给定一个常见的子结构集合，每个化合物都可以用一个具有二元属性的记录表示，这些二元属性指出化合物是否包含特定的子结构。这样的表示实际上是事务数据集，其中事务是化合物，而项是子结构。在某些情况下，容易用记录形式表示数据，但是这类表示并不能捕获数据中的所有信息。考虑这样的时间空间数据，它由空间网格每一点上的时间序列组成。通常，这种数据存放在数据矩阵中，其中每行代表一个位置，而每列代表一个特定的时间点。然而，这种表示并不能明确地表示属性之间存在的时间联系以及对象之间存在的空间联系。但并不是说这种表示不合适，而是说分析时必须考虑这些联系。例如，在使用数据挖掘技术时，假定属性之间在统计上是相互独立的并不是一个好主意。

前言

自从我和孟小峰等人翻译J. Han和M. Kamber的《数据挖掘：概念与技术》以来，我们高兴地看到数据挖掘的研究正在我国蓬勃开展。许多学者和研究人员都对这个新兴的学科领域表现出了极大的兴趣，他们之中不仅有来自数据库领域的专家，而且不乏统计学、人工智能和模式识别、机器学习等领域的研究者。国内的学者和研究者在数据挖掘方面的研究已经取得了一些令人鼓舞的成果，并且正在逐渐与国际学术界同步。 数据挖掘的产生和发展一直是分析和理解数据的实际需求推动的。数据挖掘研究的进展也正是在于一直重视与其他领域研究者的合作。数据挖掘从工业、农业、医疗卫生和商业的需求中获得动力，从统计学、机器学习等领域的长期研究与发展中汲取营养。我们相信，只要有理解数据的需求，就有推动数据挖掘研究与应用发展的动力；只要依靠多学科的团队，就能应对新的数据分析任务带来的挑战。 P. Tan、M. Steinbach和V. Kumar编写的这本《数据挖掘导论》是继《数据挖掘：概念与技术》一书之后的另一本重要的数据挖掘著作。三位作者都从事数据挖掘研究多年，其中Vipin Kumar教授是数据挖掘和高性能计算领域的国际知名学者。本书原版在正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。J. Han教授也高度评价该书：“这是一本全新数据挖掘的教材，值得大力推荐。它将成为我们的主要参考书。” 本书不需要读者具备数据库背景，只需要少量统计学或数学背景知识，而且取材涉及的学科和应用领域较多，实用性强，因此适合的读者面较广。本书强调如何用数据挖掘知识解决各种实际问题，强调所挖掘的知识模式的评估。例如，就像我们能够从天空中的白云想象出各种动物和物体一样，每个聚类算法能够从几乎所有的数据集中发现聚类。如果数据集合中根本不存在自然的簇，所产生的聚类很难说具有实际意义。 全书共分10章。范明负责第1~8章的翻译，范宏建负责第9章和第10章的翻译。蒋宏杰、贾玉祥、许红涛和温箐笛也参加本书的最初翻译工作。全书的译文由范明负责统一定稿。在翻译的过程中，对发现的错误进行了更正，并得到原书作者的确认。 感谢P. Tan、M. Steinbach和V. Kumar为中文版撰写序言。感谢人民邮电出版社图灵公司的编辑们，他们在第一时间内引进本书，并组织翻译，使得中文版能够如此之快地与读者见面。

内容概要

Pang-Ning Tan现为密歇根州立大学计算机与工程系助理教授，主要教授数据挖掘、数据库系统等课程。此前，他曾是明尼苏达大学美国陆军高性能计算研究中心副研究员（2002-2003）。

Michael Steinbach 明尼苏达大学计算机与工程系研究员，在读博士。

Vipin Kumar明尼苏达大学计算机科学与工程系主任，曾任美国陆军高性能计算研究中心主任。他拥有马里兰大学博士学位，是数据挖掘和高性能计算方面的国际权威，IEEE会士。

书籍目录

第1章 绪论
1

1.1 什么是数据挖掘
2

1.2 数据挖掘要解决的问题
2

1.3 数据挖掘的起源
3

1.4 数据挖掘任务
4

1.5 本书的内容与组织
7

文献注释
7

参考文献
8

习题
10

第2章 数据
13

2.1 数据类型
14

2.1.1 属性与度量
15

2.1.2 数据集的类型
18

2.2 数据质量
22

2.2.1 测量和数据收集问题
22

2.2.2 关于应用的问题
26

2.3 数据预处理
27

2.3.1 聚集
27

2.3.2 抽样
28

2.3.3 维归约
30

2.3.4 特征子集选择
31

2.3.5 特征创建
33

2.3.6 离散化和二元化
34

2.3.7 变量变换
38

2.4 相似性和相异性的度量
38

2.4.1 基础
39

2.4.2 简单属性之间的相似度和相异度
40

2.4.3 数据对象之间的相异度
41

2.4.4 数据对象之间的相似度
43

2.4.5 邻近性度量的例子
43

2.4.6 邻近度计算问题
48

2.4.7 选取正确的邻近性度量
50

文献注释
50

参考文献
52

习题
53

第3章 探索数据
59

3.1 鸢尾花数据集
59

3.2 汇总统计
60

3.2.1 频率和众数
60

3.2.2 百分位数
61

3.2.3 位置度量：均值和中位数
61

3.2.4 散布度量：极差和方差
62

3.2.5 多元汇总统计
63

3.2.6 汇总数据的其他方法
64

3.3 可视化
64

3.3.1 可视化的动机
64

3.3.2 一般概念
65

3.3.3 技术
67

3.3.4 可视化高维数据
75

3.3.5 注意事项
79

3.4 OLAP和多维数据分析
79

3.4.1 用多维数组表示鸢尾花数据
80

3.4.2 多维数据：一般情况
81

3.4.3 分析多维数据
82

3.4.4 关于多维数据分析的最后评述
84

文献注释
84

参考文献
85

习题
86

第4章 分类：基本概念、决策树与模型评估
89

4.1 预备知识
89

4.2 解决分类问题的一般方法
90

4.3 决策树归纳
92

4.3.1 决策树的工作原理
92

4.3.2 如何建立决策树
93

4.3.3 表示属性测试条件的方法
95

4.3.4 选择最佳划分的度量
96

4.3.5 决策树归纳算法
101

4.3.6 例子：Web 机器人检测
102

4.3.7 决策树归纳的特点
103

4.4 模型的过分拟合
106

4.4.1 噪声导致的过分拟合
107

4.4.2 缺乏代表性样本导致的过分拟合
109

4.4.3 过分拟合与多重比较过程
109

4.4.4 泛化误差估计
110

4.4.5 处理决策树归纳中的过分拟合
113

4.5 评估分类器的性能
114

4.5.1 保持方法
114

4.5.2 随机二次抽样
115

4.5.3 交叉验证
115

4.5.4 自助法
115

4.6 比较分类器的方法
116

4.6.1 估计准确度的置信区间
116

4.6.2 比较两个模型的性能
117

4.6.3 比较两种分类法的性能
118

文献注释
118

参考文献
120

习题
122

第5章 分类：其他技术
127

5.1 基于规则的分类器
127

5.1.1 基于规则的分类器的工作原理
128

5.1.2 规则的排序方案
129

5.1.3 如何建立基于规则的分类器
130

5.1.4 规则提取的直接方法
130

5.1.5 规则提取的间接方法
135

5.1.6 基于规则的分类器的特征
136

5.2 最近邻分类器
137

5.2.1 算法
138

5.2.2 最近邻分类器的特征
138

5.3 贝叶斯分类器
139

5.3.1 贝叶斯定理
139

5.3.2 贝叶斯定理在分类中的应用
140

5.3.3 朴素贝叶斯分类器
141

5.3.4 贝叶斯误差率
145

5.3.5 贝叶斯信念网络
147

5.4 人工神经网络
150

5.4.1 感知器
151

5.4.2 多层人工神经网络
153

5.4.3 人工神经网络的特点
155

5.5 支持向量机
156

5.5.1 最大边缘超平面
156

5.5.2 线性支持向量机：可分情况
157

5.5.3 线性支持向量机：不可分情况
162

5.5.4 非线性支持向量机
164

5.5.5 支持向量机的特征
168

5.6 组合方法
168

5.6.1 组合方法的基本原理
168

5.6.2 构建组合分类器的方法
169

5.6.3 偏倚—方差分解
171

5.6.4 装袋
173

5.6.5 提升
175

5.6.6 随机森林
178

5.6.7 组合方法的实验比较
179

5.7 不平衡类问题
180

5.7.1 可选度量
180

5.7.2 接受者操作特征曲线
182

5.7.3 代价敏感学习
184

5.7.4 基于抽样的方法
186

5.8 多类问题
187

文献注释
189

参考文献
190

习题
193

第6章 关联分析：基本概念和算法
201

6.1 问题定义
202

6.2 频繁项集的产生
204

6.2.1 先验原理
205

6.2.2 Apriori算法的频繁项集产生
206

6.2.3　候选的产生与剪枝
208

6.2.4 支持度计数
210

6.2.5 计算复杂度
213

6.3 规则产生
215

6.3.1 基于置信度的剪枝
215

6.3.2 Apriori算法中规则的产生
215

6.3.3 例：美国国会投票记录
217

6.4 频繁项集的紧凑表示
217

6.4.1 极大频繁项集
217

6.4.2 闭频繁项集
219

6.5 产生频繁项集的其他方法
221

6.6 FP增长算法
223

6.6.1 FP树表示法
224

6.6.2 FP增长算法的频繁项集产生
225

6.7 关联模式的评估
228

6.7.1 兴趣度的客观度量
228

6.7.2 多个二元变量的度量
235

6.7.3 辛普森悖论
236

6.8 倾斜支持度分布的影响
237

文献注释
240

参考文献
244

习题
250

第7章 关联分析：高级概念
259

7.1 处理分类属性
259

7.2 处理连续属性
261

7.2.1 基于离散化的方法
261

7.2.2 基于统计学的方法
263

7.2.3 非离散化方法
265

7.3 处理概念分层
266

7.4 序列模式
267

7.4.1 问题描述
267

7.4.2 序列模式发现
269

7.4.3 时限约束
271

7.4.4 可选计数方案
274

7.5 子图模式
275

7.5.1 图与子图
276

7.5.2 频繁子图挖掘
277

7.5.3 类Apriori方法
278

7.5.4 候选产生
279

7.5.5 候选剪枝
282

7.5.6 支持度计数
285

7.6 非频繁模式
285

7.6.1 负模式
285

7.6.2 负相关模式
286

7.6.3 非频繁模式、负模式和负相关模式比较
287

7.6.4 挖掘有趣的非频繁模式的技术
288

7.6.5 基于挖掘负模式的技术
288

7.6.6 基于支持度期望的技术
290

文献注释
292

参考文献
293

习题
295

第8章 聚类分析：基本概念和算法
305

8.1 概述
306

8.1.1 什么是聚类分析
306

8.1.2 不同的聚类类型
307

8.1.3 不同的簇类型
308

8.2 K均值
310

8.2.1 基本K均值算法
310

8.2.2 K均值：附加的问题
315

8.2.3 二分K均值
316

8.2.4 K均值和不同的簇类型
317

8.2.5 优点与缺点
318

8.2.6 K均值作为优化问题
319

8.3 凝聚层次聚类
320

8.3.1 基本凝聚层次聚类算法
321

8.3.2 特殊技术
322

8.3.3 簇邻近度的Lance-Williams公式
325

8.3.4 层次聚类的主要问题
326

8.3.5 优点与缺点
327

8.4 DBSCAN
327

8.4.1 传统的密度：基于中心的方法
327

8.4.2 DBSCAN算法
328

8.4.3 优点与缺点
329

8.5 簇评估
330

8.5.1 概述
332

8.5.2 非监督簇评估：使用凝聚度和分离度
332

8.5.3 非监督簇评估：使用邻近度矩阵
336

8.5.4 层次聚类的非监督评估
338

8.5.5 确定正确的簇个数
339

8.5.6 聚类趋势
339

8.5.7 簇有效性的监督度量
340

8.5.8 评估簇有效性度量的显著性
343

文献注释
344

参考文献
345

习题
347

第9章 聚类分析：其他问题与算法
355

9.1 数据、簇和聚类算法的特性
355

9.1.1 例子：比较K均值和DBSCAN
355

9.1.2 数据特性
356

9.1.3 簇特性
357

9.1.4 聚类算法的一般特性
358

9.2 基于原型的聚类
359

9.2.1 模糊聚类
359

9.2.2 使用混合模型的聚类
362

9.2.3 自组织映射
369

9.3 基于密度的聚类
372

9.3.1 基于网格的聚类
372

9.3.2 子空间聚类
374

9.3.3 DENCLUE：基于密度聚类的一种基于核的方案
377

9.4 基于图的聚类
379

9.4.1 稀疏化
379

9.4.2 最小生成树聚类
380

9.4.3 OPOSSUM：使用METIS的稀疏相似度最优划分
381

9.4.4 Chameleon：使用动态建模的层次聚类
381

9.4.5 共享最近邻相似度
385

9.4.6 Jarvis-Patrick聚类算法
387

9.4.7 SNN密度
388

9.4.8 基于SNN密度的聚类
389

9.5 可伸缩的聚类算法
390

9.5.1 可伸缩：一般问题和方法
391

9.5.2 BIRCH
392

9.5.3 CURE
393

9.6 使用哪种聚类算法
395

文献注释
397

参考文献
398

习题
400

第10章 异常检测
403

10.1 预备知识
404

10.1.1 异常的成因
404

10.1.2 异常检测方法
404

10.1.3 类标号的使用
405

10.1.4 问题
405

10.2 统计方法
406

10.2.1 检测一元正态分布中的离群点
407

10.2.2 多元正态分布的离群点
408

10.2.3 异常检测的混合模型方法
410

10.2.4 优点与缺点
411

10.3 基于邻近度的离群点检测
411

10.4 基于密度的离群点检测
412

10.4.1 使用相对密度的离群点检测
413

10.4.2 优点与缺点
414

10.5 基于聚类的技术
414

10.5.1 评估对象属于簇的程度
415

10.5.2 离群点对初始聚类的影响
416

10.5.3 使用簇的个数
416

10.5.4 优点与缺点
416

文献注释
417

参考文献
418

习题
420

附录A 线性代数
423

附录B 维归约
433

附录C 概率统计
445

附录D 回归
451

附录E 优化
457

编辑推荐

《数据挖掘导论(完整版)》是明尼苏达大学和密歇根州立大学数据挖掘课程的教材，由于独具特色，正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。《数据挖掘导论(完整版)》与许多其他同类图书不同，《数据挖掘导论(完整版)》将重点放在如何用数据挖掘知识解决各种实际问题。只要求具备很少的预备知识——不需要数据库背景，只需要很少的统计学或数学背景知识。《数据挖掘导论(完整版)》中包含大量的图表、综合示例和丰富的习题，并且使用示例、关键算法的简洁描述和习题，尽可能直接聚焦于数据挖掘的主要概念。教辅内容极为丰富，包括课程幻灯片、学生课题建议、数据挖掘资源（如数据挖掘算法和数据集）、联机指南（使用实际的数据集和数据分析软件，《数据挖掘导论(完整版)》介绍的部分数据挖掘技术提供例子讲解）。

作者简介

本书全面介绍了数据挖掘，涵盖了五个主题：数据、分类、关联分析、聚类和异常检测。除异常检测外，每个主题都有两章。前一章涵盖基本概念、代表性算法和评估技术，而后一章讨论高级概念和算法。这样读者在透彻地理解数据挖掘的基础的同时，还能够了解更多重要的高级主题。

本书是明尼苏达大学和密歇根州立大学数据挖掘课程的教材，由于独具特色，正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。

本书特色

        与许多其他同类图书不同，本书将重点放在如何用数据挖掘知识解决各种实际问题。

        只要求具备很少的预备知识——不需要数据库背景，只需要很少的统计学或数学背景知识。

        书中包含大量的图表、综合示例和丰富的习题，并且使用示例、关键算法的简洁描述和习题，尽可能直接地聚焦于数据挖掘的主要概念。

        教辅内容极为丰富，包括课程幻灯片、学生课题建议、数据挖掘资源（如数据挖掘算法和数据集）、联机指南（使用实际的数据集和数据分析软件，为本书介绍的部分数据挖掘技术提供例子讲解）。

        向采用本书作为教材的教师提供习题解答。

图书封面

数据挖掘导论下载精选章节试读更多精彩书评

发布书评

精彩书评 (总计5条)

看我截图吧http://weibo.com/1677386655/zu8O4ci9Otherefore, if we compute the k-dist for all the data points for some k, sort them in increasing order, and ther plot the sorted values,we expect to see a sharp change at the value of k-dist that corresponds to a suitable value of Eps.因此，如果我们对于某个k，计算所有点的k距离，以递增次序将它们排序，然后绘制排序后的值，【【注意这里开始了】】则我们会看到k距离的急剧变化，对应于合适的Eps值。【【人家是说，在相应于某个Eps值的k距离上开始急剧变化好嘛，这里的翻译很容易让读者曲解成：每一点点变化都对应于某个Eps值。直接把修饰的对象给换了】】#我很怀疑译者是用Google翻译的，Google翻译也不至于出这样的错#还有，还有再随手来一个：http://weibo.com/1677386655/ztFvpcrHw误人子弟啊！中译本是烂书！本来原著作者解释的很清楚的，让翻译的人给糟蹋的面目全非了。建议看原版，如果你对你的高中英语水平比较有信心的话。当然，原书还是很好很不错的。
我是拿这本书当作课程书的，这本书基本上涵盖了数据挖掘的许多经典算法，分类，聚类，关联规则。比较适合对数据挖掘感兴趣的人，这本书看完之后基本上就可以进行对数据的分析，挖掘了。然而这仅仅是一门入门书，对于理论部分并没有做过多的解释。如果想进一步的了解理论知识，应该需要关注下机器学习方面的书籍
它是我关于数据挖掘这一方向的入门书。书中讲了很多基础的数据挖掘算法，读完以后可以对这些算法的基本思想有个了解。书中的例子也很详尽，还是不错的。但是研究生期间是指望发论文的，这些算法从学术上来说，只能算基础入门了。至于它们在实际工业应用的情况，我也不太清楚。毕业以后再也没有做过和数据挖掘相关的事情。

精彩短评 (总计101条)

国外很多大学用这本书作教材。本人读过好多本数据挖掘方面的书，个人感觉这本比较适合入门，且相关内容解释得恰到好处，既非长篇大论，亦非偷懒引用，可见作者功力非凡。
大数据是当前比较热的前沿话题。如何研究和熟悉此类这些书是不错的
《数据挖掘导论(完整版)》是明尼苏达大学和密歇根州立大学数据挖掘课程的教材，由于独具特色，正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。很好的书。
很好的入门书籍，讲解清晰易懂~
看的第一本数据挖掘类的书。虽然叫导论，但是东西太多了。比较概述性质的，没有很深入的推导，感觉就是花了很多时间结果啥也没记住，不是很推荐入门。感觉可以作为补充读物。
项亮推荐的书
书很好，讲得透彻，能实际使用，比那本《概念与技术》要实用得多。
良心教材，感觉作者花了很多心血与此，满满诚意，循序渐进而且严谨。中国的教材应该学习这种不生编硬套的思路。基本每一种思路都有足够专业的图表来解释，很赞！
不可多得的好书。
内容比较全，但是没有回归分析，数学方面不深，提点为主，很多东西放在习题和参考资料里了。看完对主要数据挖掘算法和基本原理就有了大体的了解。适合入门
本科教材用的这本书。里面的例子很贴合实际应用，因此理解起来也比较容易。
对我一个没有基础的人简单易懂，例子挺全，要是有实现代码就更好了
数据挖掘基础概念
开学时买的书，一个学期的学习觉得这本书非常适合初学者。内容注重概念的理解，弱化了数学推理的过程，对于数据挖掘中的基本概念如分类和聚类等都解释的通俗易懂。
DM字典
本来以为随便看看就好，还是发现好一些新观点和好内容，扩展资料导引比较好，关于关联分析讲得尤其不错
作为初学数据挖掘的人来说是蛮不错的一本书
教材
书不错，纸质也不错，比一起买的《数据挖掘概念与技术（原书第2版）》纸质好多了。
身为导论已很是详尽
书不错，翻译的非常不错。质量也不错，是学数据挖掘的好书。。。
认真研读
the first book of data mining I read
数据挖掘字典型工具书。介绍的很全。但缺点是介绍的有些泛泛，除了算法。大部分都没讲具体如何实现。只是把过程讲了
作为初学者，看这本书实在是太好了，给我奠定了这门课很多的基本概念，对学习很有帮助！
数据挖掘中的好书，有点难度，对数学要求高
涉及的内容很广泛，每块内容都讲得很详细，理论配合实例让人很容易理解！
真是我们学校的研究生教材，老师推荐的。的确很好。
数据挖掘上学时没认真听，弄到工作了，需要用到数据挖掘了，还要自己去自学，于是就买一本导论，基础一点的，这样容易上手，往后再买进阶的书籍。现在刚收到书，还没仔细看，但估计书的内容不会差到哪里去的。好好学习！！！
书收到了，服务态度很好，书的质量也很好，内容挺符合我的需求，对算法描述的很多，总之，很满意
书不错，纸张很好。就是送书的时候没包装，导致书脚那块坏了一点。这个核另外一本《数据挖掘概念》都不错。
深入浅出，是本入门的好书，力荐
泛泛而谈，入门不错。每个知识点几乎都能写成一本书，但是只写成了一小节。忽略了很多高深的数学知识，不过章末提供了很多文献，而且练习题也很给力。不求甚解的看一遍对数据挖掘入门确实不错。
还不错，看完这本书才知道dimension reduction居然翻译成维归约，什么鬼。。
讲原理和简单应用，适合我这种初学者
本书是入门数据挖掘一本非常好的梳理知识体系的书籍，起到很棒的引导作用。
很不错的书，做数据挖掘一定要看
一本非常好的数据挖掘书籍。不仅适合初学者，对已经在行业工作的人也非常有帮助。行文流畅，翻译的也很不错。
学数据挖掘必看的书
概括性的介绍，入门以及平时需要时翻阅。
对于专业人士可以研究研究非专业的只能了解
今天送到了，不愧是当当，送货速度很快啊，而且送货员态度还很好，很满意，收到之后大致翻着看了一下，应该是很不错的一本书，图文并茂的，而且讲的内容很多，很全面，但是看到了很多的数学公式，唉！对数学不感冒啊，真担心后面看起来效果会如何！但是书是好书，这点不容置疑！
别看什么《数据挖掘概念与技术》了
数据挖掘方面的入门书~
入门数据挖掘的第一本书，框架很清晰，由简入繁。感觉不错
还没读，感觉不错，对数据分析有帮助
老师推荐的教材~中文版挺不错的~就是价格略高~
这本书很不错，学习一下数据挖掘。
入门读物。初步了解各类算法。
这本书里，对于聚类的描述是全书的亮点
作为导论，框架建立的很详细。好多习题。快速的翻了遍，还好有概率论、统计学基础，但是有些概念不太懂，作为了解应该再去找本趣味性的数据挖掘。感觉每一章节应该都可以写的更详细可以写成一本单独的书。有机会再读。作为导论也不会有实际应用了；另外导论有些名词有解释更好了；
这书光每章后面的参考文献就值五颗星，更别说书的整个架构几乎覆盖了数据挖掘的方方面面，绝对值五星！！！
从知乎知道的这本书，目前在做数据分析，但是想从事数据仓库或挖掘可看，非常经典
书非常好龙星计划数据挖掘的推荐用书
初次看很简单回顾了几次统计学的思想还是很不错的 sampling能讲更多就好了
这是我最喜欢的数据挖掘教程~
囫囵吞枣的把这本书读完了，增长了见识，以后有用到的地方，还要深入学习
入门教材，很不错
比较入门，说他理论，数学推导又不够详尽；说他应用，又没给出任何实例和具体编程的算法实现。。但可读性还是不错
这是一本比较经典的数据挖掘的书了吧，感觉很不错！
比较适合想对数据挖掘进行较深入研究了解的人士。
理论入门书
书的质量很好，东西很全面。内容还算比较新。算是导论吧！
经典的数据挖掘技术宝典，理论性非常强，知识面也很广
深入浅出，适合刚接触数据挖掘的人
数据挖掘系列丛书中质量不错的书，值得购买
比较深奥的书，需要花时间看
想了解下数据挖掘方面的东西，得好好读读了！
比较系统
这本书介绍的知识比较广泛
内容详实，对数据挖掘的概念介绍的很清楚
這翻譯活生生的逼我花錢買英文版
用了将近4个月才陆陆续续读完...还是囫囵吞枣式的...对自己的智商产生了深深的怀疑...
书的质量不错，送货也很快，可是使用10元优惠券后居然没有找到发票？
早就知道这本书，需要了解更多数据挖掘，买来看，应该能有帮助。就是不知道里面一些数学的、计算机的知识能否理解。努力！
很不错，老师推荐的教材，摸起来纸质非常好，很有看的欲望！
入门与进阶之间读的一本书 10年左右对我帮助很大感情分5分
数据挖掘必备
大概翻过一遍。现在看来，此书同众多可以用作学校教材的书目一样，理论和方法方面面面俱到，举的栗子都像模型和玩具，缺乏的是从理论到解决实际工业问题的那座桥。
猴年第十一本书。名副其实的大块头。
学数据挖掘的必备教程，理论知识很充足
我以为就是一些商业数据的分析。结果里面涉及到数据库，数据结构，等更深的一些算法的东西，俺还消化不了，
数据挖掘领域不错的一本书
多方位介绍了数据挖掘知识，入门必读。。
泛泛而谈不深入
适合对数据挖掘有兴趣的零基础的朋友
还行，后面的文献还行
作为了解数据挖掘基本概念不错
后边翻译的有点烂，很系统的介绍了分类分析，关联分析，聚类分析
看得出是位认真的作者，每一章结尾有超多外文参考文献。作为研究生的入门教材不错
翻了一周，看了下框架和普及了下知识体系。但感觉翻译一般，比另外一本同译者的《数据挖掘：概念与技术》有些差距
这本书不需要说太多，大家都懂的.
神书，覆盖面广泛，内容又细致，既可以用来翻一翻扩宽眼界，又可以细读了解各个算法细致的边界条件和特例
这是一本系统性地介绍数据挖掘理论与技术的图书，非常适合入门到潜心钻研的人士。
学习数据挖掘的童鞋都应该人手一本，这边书算是介绍得比较深入浅出
对于初入门者来说比较合适，没有过于晦涩难懂，通俗地阐述了数据挖掘的基本算法，十分推荐
这是一本十分经典数据挖掘书籍
我研究生导师推荐读的书，很不错哦
多即是少。但倒是一个好导论。
好书，从事该行业的入门教程
入门级读物
理论加实战的书都是好书。里面以论文和示例的形式阐述推荐算法，对实战有很好的指导意义

数据挖掘导论

发布书评

精彩书评 (总计5条)

精彩短评 (总计101条)

类似图书

相关图书推荐