数据仓库与数据挖掘技术

当前位置:首页 > 教材 > 研究生/本专科 > 数据仓库与数据挖掘技术

出版社:清华大学
出版日期:2011-6
ISBN:9787302247012
作者:张兴会
页数:213页

章节摘录

版权页:插图:通过遥感、地理信息系统、医学和卫星图像等多种数据采集设备收集到了大量的空间数据,这些空间数据远远超过了人脑的分析能力。空间数据不同于关系数据,它一般具有空间拓扑或距离信息,通常需要以复杂的多维空间索引结构组织,另外空间数据的处理还常常需要空间推理、几何计算和空间知识表示技术。这些特性使得从空间数据中挖掘信息具有很多挑战性。11.3.1 空间数据的复杂性特征空间数据的复杂性特征主要表现在以下几个方面。1.空间属性之间的非线性关系空间属性之间的非线性关系是空间系统复杂性的重要标志,其中蕴含着系统内部运作的复杂机制,因而被作为空间数据挖掘的主要任务之一。2.空间数据的多尺度特征空间数据的多尺度性是指空间数据在不同观察层次上所遵循的规律以及体现出不尽相同的特征。多尺度特征是空间数据复杂性的又一表现形式,利用该性质可以探究空间信息在泛化和细化过程中所反映出的特征渐变规律。3.空间信息的模糊性空间数据复杂性的另一个特征就是模糊性。模糊性几乎存在于各种类型的空间信息中,如空间位置的模糊性、空间相关性的模糊性以及模糊的属性值等。4.空间维数的增高空间数据的属性增加极为迅速,如在遥感领域,由于传感技术的飞速发展,波段的数目也由几个增加到几十甚至上百个,如何从几十甚至几百维空间中提取信息、发现知识成为研究中的又一难点。5.空间数据的缺值数据的缺值现象源自于某种不可抗拒的外力而使数据无法获得或发生丢失。如何对丢失数据进行恢复并估计数据的固有分布参数,成为解决数据复杂性的难点。11.3.2 空间数据挖掘的定义空间数据挖掘是指在空间数据库的基础上,综合利用各种技术方法,从大量的空间数据中自动挖掘事先未知的且潜在有用的知识,提取非显式存在的空间关系或其他有意义的模式等,揭示出蕴含在数据背后的客观世界的本质规律、内在联系和发展趋势,实现知识的自动获取,从而提供技术决策与经营决策的依据。

书籍目录

第1章 数据挖掘和数据仓库概述 1.1 数据挖掘引论  1.1.1 数据挖掘的由来  1.1.2 数据挖掘的定义  1.1.3 数据挖掘的功能  1.1.4 数据挖掘的常用方法 1.2 数据仓库引论  1.2.1 数据仓库的产生与发展  1.2.2 数据仓库的定义  1.2.3 数据仓库与数据挖掘的联系与区别 1.3 数据挖掘的应用  1.3.1 数据挖掘的应用领域  1.3.2 数据挖掘案例 1.4 常用数据挖掘工具  1.4.1 数据挖掘工具的种类  1.4.2 评价数据挖掘工具优劣的指标  1.4.3 常用数据挖掘工具 小结 习题第2章 数据仓库 2.1 数据仓库的基本概念 2.2 数据仓库的体系结构  2.2.1 元数据  2.2.2 粒度的概念  2.2.3 分割问题  2.2.4 数据仓库中的数据组织形式 2.3 数据仓库的数据模型  2.3.1 概念数据模型  2.3.2 逻辑数据模型  2.3.3 物理数据模型  2.3.4 高层数据模型、中间层数据模型和低层数据模型 2.4 数据仓库设计步骤  2.4.1 概念模型设计  2.4.2 技术准备工作  2.4.3 逻辑模型设计  2.4.4 物理模型设计  2.4.5 数据仓库的生成  2.4.6 数据仓库的使用和维护 2.5 利用SQL Server 2005构建数据仓库 小结 习题第3章 联机分析处理技术 3.1 OLAP概述  3.1.1 OLAP的由来  3.1.2 OLAP的一些基本概念  3.1.3 OLAP的定义与特征 3.2 OLAP中的多维分析操作  3.2.1 钻取  3.2.2 切片和切块  3.2.3 旋转 3.3 OLAP的基本数据模型  3.3.1 多维联机分析处理  3.3.2 关系联机分析处理  3.3.3 MOLAP和ROLAP的比较  3.3.4 混合型联机分析处理 3.4 OLAP的衡量标准 3.5 基于SQL Server 2005的OLAP实现 小结 习题第4章 数据预处理 4.1 数据预处理概述  4.1.1 原始数据中存在的问题  4.1.2 数据预处理的方法和功能 4.2 数据清洗  4.2.1 属性选择与处理  4.2.2 空缺值处理  4.2.3 噪声数据处理  4.2.4 不平衡数据的处理 4.3 数据集成和变换  4.3.1 数据集成  4.3.2 数据变换 4.4 数据归约  4.4.1 数据归约的方法  4.4.2 数据立方体聚集  4.4.3 维归约  4.4.4 数据压缩  4.4.5 数值归约  4.4.6 离散化与概念分层生成 小结 习题第5章 关联规则方法 5.1 关联规则的概念和分类  5.1.1 关联规则的概念  5.1.2 关联规则的分类 5.2 Apriori算法  5.2.1 产生频繁项集  5.2.2 产生频繁项集的实例  5.2.3 从频繁项集产生关联规则 5.3 FP-Growth算法  5.3.1 FP-Growth算法计算过程  5.3.2 FP-Growth算法示例 5.4 利用SQ Server 2005进行关联规则挖掘 小结 习题第6章 决策树方法 6.1 信息论的基本原理  6.1.1 信息论原理  6.1.2 互信息的计算 6.2 常用决策树算法  6.2.1 ID3算法  6.2.2 C4.5算法 6.3 决策树剪枝  6.3.1 先剪枝  6.3.2 后剪枝 6.4 由决策树提取分类规则  6.4.1 获得简单规则  6.4.2 精简规则属性 6.5 利用SQL Server 2005进行决策树挖掘  6.5.1 数据准备  6.5.2 挖掘模型设置  6.5.3 挖掘流程  6.5.4 挖掘结果分析  6.5.5 挖掘性能分析 小结 习题第7章 统计学习方法 7.1 朴素贝叶斯分类  7.1.1 贝叶斯定理  7.1.2 朴素贝叶斯分类 7.2 贝叶斯信念网络  7.2.1 贝叶斯信念网络  7.2.2 贝叶斯网络的特点  7.2.3 贝叶斯网络的应用 7.3 EM算法  7.3.1 估计k个高斯分布的均值  7.3.2 EM算法的一般表述 7.4 回归分析  7.4.1 一元线性回归  7.4.2 多元线性回归  7.4.3 非线性回归 7.5 利用SQL Server 2005进行线性回归分析 小结 习题第8章 人工神经网络方法 8.1 人工神经网络的基本概念  8.1.1 人工神经元原理  8.1.2 人工神经网络拓扑结构  8.1.3 人工神经网络学习算法  8.1.4 人工神经网络泛化 8.2 误差反向传播(BP)神经网络  8.2.1 BP神经网络的拓扑结构  8.2.2 BP神经网络学习算法  8.2.3 BP神经网络设计 8.3 自组织特征映射(SOFM)神经网络  8.3.1 SOFM神经网络的拓扑结构  8.3.2 SOFM神经网络聚类的基本算法  8.3.3 SOFM神经网络学习算法分析 8.4 Elman神经网络  8.4.1 Elman神经网络的拓扑结构  8.4.2 Elman神经网络权值计算 8.5 Hopfield神经网络  8.5.1 Hopfield神经网络的拓扑结构  8.5.2 Hopfield神经网络学习算法概述  8.5.3 离散Hopfield神经网络  8.5.4 连续Hopfield神经网络 8.6 利用SQL Server 2005神经网络进行数据挖掘  8.6.1 数据准备  8.6.2 挖掘流程 小结 习题第9章 聚类分析 9.1 聚类概述  9.1.1 聚类简介  9.1.2 聚类的定义  9.1.3 聚类的要求 9.2 聚类分析中的相异度计算  9.2.1 聚类算法中的数据结构  9.2.2 区间标度变量及其相异度计算  9.2.3 二元变量及其相异度计算  9.2.4 标称型变量及其相异度计算  9.2.5 序数型变量及其相异度计算  9.2.6 比例标度型变量及其相异度计算  9.2.7 混合类型变量的相异度计算 9.3 基于划分的聚类方法  9.3.1 k-平均算法  9.3.2 k-中心点算法 9.4 基于层次的聚类方法 9.5 谱聚类方法  9.5.1 谱聚类的步骤  9.5.2 谱聚类的优点  9.5.3 谱聚类实例 9.6 利用SQL Server 2005进行聚类分析  9.6.1 挖掘流程  9.6.2 结果分析 小结 习题第10章 粗糙集方法 10.1 粗糙集的基本概念  10.1.1 等价关系与等价类  10.1.2 信息表与决策表  10.1.3 下近似与上近似 10.2 基于粗糙集的属性约简  10.2.1 属性约简的有关概念  10.2.2 基于粗糙集的几种属性约简算法 10.3 基于粗糙集的决策规则约简  10.3.1 决策规则的定义  10.3.2 决策规则的约简 10.4 粗糙集的优缺点  10.4.1 粗糙集的优点  10.4.2 粗糙集的缺点 小结 习题第11章 复杂结构数据挖掘 11.1 文本数据挖掘  11.1.1 文本数据的特点  11.1.2 文本挖掘的定义  11.1.3 文本挖掘的主要任务  11.1.4 文本挖掘的一般过程  11.1.5 文本挖掘的应用 11.2 Web数据挖掘  11.2.1 Web数据的特点  11.2.2 Web挖掘的定义  11.2.3 Web挖掘分类  11.2.4 Web挖掘过程  11.2.5 Web数据挖掘的应用 11.3 空间数据挖掘  11.3.1 空间数据的复杂性特征  11.3.2 空间数据挖掘的定义  11.3.3 空间数据挖掘知识的类型  11.3.4 空间数据挖掘的用途 11.4 多媒体数据挖掘  11.4.1 多媒体数据挖掘的概念  11.4.2 多媒体挖掘的分类 小结 习题参考文献

编辑推荐

《数据仓库与数据挖掘技术》是教育部“高等学校教学质量与教学改革工程”立项项目。

作者简介

《数据仓库与数据挖掘技术》内容简介:数据仓库与数据挖掘是计算机专业和其他一些与计算机技术关系密切专业必修的核心课程。《数据仓库与数据挖掘技术》系统地介绍了数据仓库和数据挖掘的基本概念、相关知识和基本方法,每种数据挖掘方法都有详尽的实例描述和具体实现步骤。《数据仓库与数据挖掘技术》结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;《数据仓库与数据挖掘技术》坚持理论与实际相结合,概念和具体方法相结合,使知识具体化,生动化;实例实现的过程建立在sql 2005数据挖掘软件的基础上,以帮助读者在学习后达到学以致用的目的。
《数据仓库与数据挖掘技术》可以作为计算机类、信息类等相关专业本科生数据挖掘课程的教材,也可以作为其他专业技术人员的自学参考书。

图书封面


 数据仓库与数据挖掘技术下载



发布书评

 
 


精彩短评 (总计4条)

  •     被另外件商品影响了心情,服务一般
  •     不错的书,只是要很好的数据知识
  •     侧重理论介绍和分析,包含知识面广,入门的时候,作为参考资料看看可以的,讲解的一般,有一定参考价值!
  •     理论讲授比较简单,又有实践操作,很好,挺实用的。
 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024