当前位置:首页 > 计算机网络 > 数据库 > 基于Clementine的数据挖掘
出版社:中国人民大学
出版日期:2012-3
ISBN:9787300151625
作者:薛薇//陈欢歌
页数:467页
章节摘录
版权页:第一章 数据挖掘和Clementine使用概述20世纪90年代中后期以来,数据挖掘作为具有鲜明跨学科色彩的应用研究领域,已成为众多行业数据分析者瞩目的焦点。数据挖掘是一个利用各种方法,从海量数据中提取隐含和潜在的对决策有用的信息和模式的过程。因具有处理和分析海量数据的能力,注重弱化分析方法本身对数据的限制,以满足数据建模的合理性和适应性,强调与计算机技术相结合,以实现数据分析的可操作性和可实现性,数据挖掘正逐步成为数据分析应用实践的新生代和领军者。同时,随着数据挖掘方法的不断成熟及其应用的日益普及,数据挖掘软件的研发也取得了可喜的成果。目前,以SPSSClementine为代表的数据挖掘软件,已行之有效地将束之高阁的数据挖掘理论成果解放到数据分析实践中,并普遍应用于商业、社会、经济、教育、金融、医学等领域,成为数据分析的主流工具。1.1 数据挖掘的产生背景数据挖掘是在计算机数据库技术蓬勃发展、人工智能技术应用领域不断拓展、统计分析方法不断丰富发展的进程中,有效迎合数据分析的实际需求而逐步形成和发展起来的具有鲜明跨学科色彩的应用研究领域。1.1.1 海盆数据的分析需求催生数据挖掘20世纪80年代以来,随着计算机数据库技术和产品的日益成熟以及计算机应用的普及和深化,各行业部门的数据采集能力得到了前所未有的提高。各组织通过其内部的业务处理系统、管理信息系统以及外部网络系统,获得并积累了浩如烟海的数据。
内容概要
薛薇,工学硕士、经济学博士,中国人民大学统计学院副教授,教育部人文社会科学重点研究基地:中国人民大学应用统计学科研究中心副主任。关注数据挖掘及统计分析方法,统计和数据挖掘软件应用,统计数据库系统研发等方面,涉足网络新媒体传播和互动模式建模、政府和官方微博分析、学科学术热点跟踪等文本挖掘和统计应用领域,以及以数据挖掘为依托的客户关系管理等。主要代表作:《SPSS统计分析方法及应用》、《Clementine数据挖掘方法及应用》、《基于信息技术的统计信息系统》。
陈欢歌,副教授,工学硕士,现任教于北京培黎职业学院。主要从事计算机应用教学与管理工作。曾在计算机公司从事软件开发和计算机系统集成工作。
书籍目录
第1章 数据挖掘和Clementine使用概述 1.1 数据挖掘的产生背景 1.2 什么是数据挖掘 1.3 Clementine软件概述第2章 Clementine的数据读入和数据集成 2.1 变量类型 2.2 读人数据 2.3 生成实验方案 2.4 数据集成第3章 Clementine的数据理解 3.1 变量说明 3.2 数据质量的评估和调整 3.3 数据的排序 3.4 数据的分类汇总 3.5 用户报表第4章 Clementine的数据准备 4.1 变量变换 4.2 变量派生 4.3 数据精简 4.4 数据筛选 4.5 数据准备的其他工作第5章 Clementine的基本分析 5.1 数值型变量的基本分析 5.2 两分类型变量相关性的研究 5.3 两总体的均值比较 5.4 rfm分析第6章 Clementine的数据精简 6.1 变量值的离散化处理 6.2 特征选择 6.3 因子分析第7章 分类预测:Clementine的决策树 7.1 决策树算法概述 7.2 Clementine的c5.0算法及应用 7.3 Clementine的分类回归树及应用 7.4 Clementine的chaid算法及应用 7.5 Clementine的quest算法及应用 7.6 模型的对比分析第8章 分类预测:Clementine的人工神经网络 8.1 人工神经网络算法概述 8.2 Clementine的b-p反向传播网络 8.3 Clementine的b-p反向传播网络的应用 8.4 Clementine的径向基函数网络及应用第9章 分类预测:Clementine的支持向量机 9.1 支持向量分类的基本思路 9.2 支持向量分类的基本原理 9.3 支持向量回归 9.4 支持向量机的应用第10章 分类预测:Clementine的logistic回归分析 10.1 logistic回归分析概述 10.2 二项logistic回归分析 10.3 二项logistic回归分析的应用 10.4 多项logistic回归分析及应用第11章 分类预测:Clementine的判别分析 11.1 距离判别法 11.2 fisher判别法 11.3 贝叶斯判别法 11.4 判别分析的应用第12章 分类预测:Clementine的贝叶斯网络 12.1 贝叶斯方法基础 12.2 贝叶斯网络概述 12.3 tan贝叶斯网络 12.4 马尔科夫毯网络 12.5 贝叶斯网络的应用第13章 探索内部结构:Clementine的聚类分析 13.1 聚类分析的一般问题 13.2 Clementine的k-means聚类及应用 13.3 Clementine的两步聚类及应用 13.4 Clementine的kohonen网络聚类及应用 13.5 基于聚类分析的离群点探索第14章 探索内部结构:Clementine的关联分析 14.1 简单关联规则及其有效性 14.2 Clementine的apriori算法及应用 14.3 Clementine的gri算法及应用 14.4 Clementine的序列关联及应用参考文献
编辑推荐
《基于Clementine的数据挖掘》适合于从事数据分析的各应用领域的读者,尤其适合于商业销售、财会金融、证券保险、经济管理、社会研究、人文教育等行业的相关人员。同时,也能够作为高等院校计算机类、财经类、管理类专业本科生和研究生的数据挖掘教材。
作者简介
《基于Clementine的数据挖掘》内容简介:数据挖掘这种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。Clementine软件以其卓越的运算处理能力和图形展现能力、优秀的算法、行之有效的统计分析方法成为解决数据挖掘问题的理想工具。
作者基于长期从事计算机数据分析教学与科研工作的经验编写了《基于Clementine的数据挖掘》,在编写过程中体现出以下特色:以数据挖掘过程为线索介绍Clementine软件。薛薇和陈欢歌编著的《基于Clementine的数据挖掘》以数据挖掘的实践过程为主线,从Clementine数据管理入手,说明问题从浅至深,讲解方法从易到难。这样,能使读者在较短时间内掌握Clementine的基本功能和一般方法,并可迅速运用到实际工作中。
数据挖掘方法、软件操作、案例分析的有机结合。配合实际案例,侧重数据挖掘方法核心思想和基本原理的阐述,使得读者可以直观理解方法,并正确掌握方法的应用范围。
数据挖掘方法讲解全面,语言通俗。《基于Clementine的数据挖掘》对Clementine的数据挖掘算法进行了全面分析和应用,内容力求丰富翔实。同时使用通俗的语言和示例讲述算法,尽量避免使用公式和推导堆砌算法。
图书封面