数据仓库与数据挖掘原理及应用

当前位置:首页 > 网络编程 > 数据库 > 数据仓库与数据挖掘原理及应用

出版社:清华大学
出版日期:2011-1
ISBN:9787302228196
作者:郑岩
页数:300页

章节摘录

插图:进入信息时代以来,特别是近些年,数据库规模日益扩大,数据呈爆炸性增长。图灵奖获得者吉姆·格雷提出了一个经验定律,即网络环境下每18个月产生的数据量等于有史以来的数据量之和,仅仅依靠数据库管理系统的查询检索机制和统计分析方法,已经远远不能满足实际需求,面临着“数据爆炸,知识匮乏”的严峻挑战。例如股票经纪人需要从日积月累的大量股票行情变化的历史记录(数据)中发现其规律以预测未来的趋势;天文学家需要从获取的观测数据(其规模可达数千吉字节)中发现新的遥远天体及其运动规律;医生需要从大量病人电子病历中发现某种疾病的起因、症状等。这些数据的共同特点是:其一数据量巨大,一般都是GB级乃至TB级;其二都以结构化的形式存储在数据库中,包含了大量潜在、有价值的知识,有的已被发现,有的还未被发现。如何有效地管理和利用数据库中的海量数据,以及如何发现其中潜在的知识,需要一种新的、更为有效的手段对各种数据源进行整合并挖掘以发现新知识,更好地发挥这些数据的潜能。因此,数据仓库(Data Warehouse,DW)和数据挖掘(Data Mining,DM)技术应运而生。数据仓库是一个可更好地支持企业或组织决策,面向主题的、集成的、相对稳定的、随时间不断变化的数据集合;数据挖掘则是使用计算机对大量数据进行快速、有效地分析和处理,从中提取知识,并以一种形式化的、可以理解的方式表达,以便于决策的过程。目前,数据仓库和数据挖掘技术已经成为计算机领域的研究热点之一,引起了数据库、机器学习、统计分析等领域专家的广泛关注。

前言

数据仓库是将大量传统数据库数据进行抽取、清洗和转换,并按主题进行重新组织,可比喻为随时间推移不断丰富的“宝藏”;而数据挖掘是从海量数据中发现人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息,挖掘的知识表示形式为概念、规则、规律和模式等,可比喻为“淘宝”。随着Internet的迅速普及和广泛应用,每天都产生大量各种各样的信息,但它们背后到底稳藏着什么,这驱使人类不断探索。工欲善其事必先利其器。在当今信息爆炸的时代,数据挖掘堪比“利器”,让我们面对海量数据时不再感到茫然和不知所措。随着数据仓库的发展和应用,数据挖掘将展现无限的生机和活力,可以辅助、部分代替甚至拓展人的智能和决策,造福人类。数据经整合汇总为信息,信息经挖掘抽象为知识,知识是智能的基石。因此,信息化到知识化再到智能化将是人类社会发展的必然趋势。数据仓库和数据挖掘正逐步渗透和深人到社会的各个领域,并不断催生新的应用。本书主要介绍数据仓库和数据挖掘的理论、方法、技术及其应用。此外,用较多篇幅阐述数据仓库和数据挖掘新的应用实例。全书分为三篇。第一篇介绍数据仓库的起源和演变过程,阐述数据仓库的定义、体系结构、组成、元数据、数据粒度和数据模型以及ETL过程,论述数据仓库设计和实现的方法,并结合具体应用详细阐述了如何构建数据仓库及其主要应用,包括OLAP和0LAM等。第二篇介绍数据挖掘的起源和发展趋势,以及数据挖掘与web挖掘的技术和方法,包括聚类分析、分类、预测和关联分析等,详细分析了数据挖掘在电信领域的具体应用,如客户细分、重入网识别和WAP日志挖掘等。第三篇讨论数据、信息和知识的关系,论述知识表示的主要方法和知识管理的核心技术,介绍当前研究热点——语义网和本体的核心技术和方法,分析了语义网和本体的主要应用。

书籍目录

第一篇  数据仓库第1章  数据仓库基础  1.1  引言    1.1.1  演变过程    1.1.2  定义  1.2  体系结构    1.2.1  两层的体系结构    1.2.2  三层的体系结构  1.3  组成  1.4  元数据    1.4.1  定义和分类    1.4.2  标准化    1.4.3  CWM    1.4.4  UML、MOF和XMI与CWM的关系  1.5  数据粒度  1.6  数据模型  1.7  ETL    1.7.1  主要流程    1.7.2  数据抽取    1.7.3  数据转换    1.7.4  数据加载第2章  数据仓库设计和实现  2.1  数据仓库设计    2.1.1  设计方法    2.1.2  体系结构设计    2.1.3  数据模型设计  2.2  ETL设计  2.3  数据仓库实现第3章  数据仓库实例  3.1  实例一    3.1.1  选择主题    3.1.2  逻辑模型设计    3.1.3  物理模型设计    3.1.4  ETL设计  3.2  实例二    3.2.1  总体结构设计    3.2.2  概念模型设计    3.2.3  逻辑模型设计    3.2.4  物理模型设计    3.2.5  数据清洗设计    3.2.6  ETL设计第4章  OLAP和OLAM  4.1  OLAP  4.2  OLAM    4.2.1  体系结构    4.2.2  特点    4.2.3  基于Web的OLAM    第二篇  数据挖掘第5章  数据挖掘基础  5.1  概述    5.1.1  定义    5.1.2  功能    5.1.3  模型    5.1.4  展望  5.2  实现  5.3  工具    5.3.1  概述    5.3.2  比较第6章  聚类分析  6.1  硬聚类    6.1.1  算法种类    6.1.2  相似度计算    6.1.3  实现方法    6.1.4  主要算法  6.2  模糊聚类    6.2.1  概述    6.2.2  主要算法  6.3  评价第7章  分类和预测  7.1  神经网络  7.2  决策树  7.3  实现过程第8章  关联分析  8.1  概述  8.2  Apriori  8.3  FP-Growth第9章  Web挖掘  9.1  概述    9.1.1  定义    9.1.2  自然语言理解    9.1.3  Web挖掘过程  9.2  Web文档抽取和表示    9.2.1  Web文档抽取    9.2.2  Web文档表示  9.3  特征提取  9.4  Web聚类  9.5  Web分类    9.5.1  朴素贝叶斯    9.5.2  其他方法    9.5.3  评价第10章  数据挖掘实例  10.1  TOM和eTOM  10.2  客户细分    10.2.1  客户生命周期    10.2.2  客户价值    10.2.3  数据准备    10.2.4  分析过程    10.2.5  结果  10.3  重入网识别    10.3.1  定义    10.3.2  数据准备    10.3.3  分析过程    10.3.4  结果  10.4  WAP日志挖掘    10.4.1  定义    10.4.2  数据准备    10.4.3  分析过程    10.4.4  结果    第三篇  语义网和本体第11章  知识  11.1  概述  11.2  知识分类  11.3  知识表示    11.3.1  知识表示观    11.3.2  知识表示方法  11.4  知识管理    11.4.1  概述    11.4.2  知识管理与信息管理的关系    11.4.3  核心技术第12章  语义网和本体  12.1  语义网    12.1.1  概述    12.1.2  层次结构    12.1.3  元数据    12.1.4  核心技术    12.1.5  开发工具Jena    12.1.6  Web 3.0  12.2  本体    12.2.1  哲学本源    12.2.2  定义    12.2.3  建模    12.2.4  分类    12.2.5  构建方法    12.2.6  描述语言    12.2.7  实例参考文献

编辑推荐

《数据仓库与数据挖掘原理及应用》由清华大学出版社出版。

作者简介

《数据仓库与数据挖掘原理及应用》从专业角度全面介绍了数据仓库和数据挖掘的理论、方法、技术及其应用,系统地阐述了数据仓库和数据挖掘的产生、发展和应用及其主要概念、原理和算法,并结合当前数据仓库和数据挖掘中一些新的应用实例进一步加以说明,力求学以致用。
全书分为三篇。第一篇介绍数据仓库的起源和演变过程,阐述数据仓库的定义、体系结构、组成、元数据、数据粒度和数据模型以及ETL过程,论述数据仓库设计和实现的方法。结合具体应用详细阐述了如何构建数据仓库及其主要应用,包括OLAP和OLAM等。第二篇介绍数据挖掘的起源和发展趋势,以及数据挖掘与web挖掘的技术和方法,包括聚类、分类、预测和关联分析等,详细分析了数据挖掘在电信领域的具体应用,如客户细分、重入网识别和WAP日志挖掘等。第三篇讨论数据、信息和知识的关系,论述知识表示的主要方法和知识管理的核心技术,介绍当前研究热点——语义网和本体的核心技术和方法,分析了语义网和本体的主要应用。
《数据仓库与数据挖掘原理及应用》可作为计算机专业研究生或高年级本科生教材,也可以作为计算机研究和开发人员以及相关专业人士的参考资料。

图书封面


 数据仓库与数据挖掘原理及应用下载



发布书评

 
 


精彩短评 (总计4条)

  •     货物质量好。卖家很好,货物很棒。不要一般的好啊,太好了
  •     师兄都说要学好数据挖掘==
  •     书是全新的,也没有什么损伤,不错,只是快递稍稍有点慢而已,一切都好~
  •     内容虽然涉及到技术方面的,但是讲述很容易懂,实例分析很有启发。
 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024