基于Web挖掘的个性化信息推荐

当前位置:首页 > 管理 > 管理信息系统 > 基于Web挖掘的个性化信息推荐

出版社:科学出版社
出版日期:2010-5
ISBN:9787030274465
页数:186页

章节摘录

插图：美国未来学家奈斯比特说过：我们在信息海洋中淹溺，但却不得不面临知识饥渴。这形象地描绘了目前人们在互联网时代所处的困境：一方面是日益泛滥的信息，另一方面却是有用知识的缺失。由此，Web用户获取信息的机会成本不断上升，迫切需要从这些纷繁芜杂的信息中找到有用知识的工具。鉴于数据挖掘的日益成熟和完善，人们自然而然想到要把数据挖掘技术应用到Web上来，即将数据挖掘的思想和方法应用于Web，利用Web挖掘从Web文档和Web活动中提取感兴趣的、潜在的、有用的模式和隐含信息。Web信息的多样性决定了Web挖掘的多样性。根据处理对象的不同，可以将Web挖掘分为三类：Web内容挖掘、Web结构挖掘和Web使用挖掘。Web内容挖掘是指从Web文件的内容及其描述中获取有用信息的过程，可以用于Web页面特征提取、基于内容的Web页面聚类、Web页面之间内容的关联规则发现等；Web结构挖掘是从WWW的组织结构和链接结构中发现知识的过程，可用于Web页面分类，并由此获得有关不同Web页面之间相似度及关联度的信息，并有助于发现权威Web站点；Web使用挖掘是从Web站点服务器日志中发现有用知识和模式的过程。Web站点服务器日志记录了Web用户的行为轨迹，分析这些数据可以帮助理解Web用户的行为，从而提供个性化信息服务。3.Web挖掘的复杂性分析相对于面向数据库的数据挖掘而言，面向Web的数据挖掘要复杂得多，主要表现在以下三个方面。1）Web用户的复杂性。相对传统的数据库应用系统而言Web信息系统面对的是一个广泛的、形形色色的Web用户群体，几乎覆盖了社会的各个领域和阶层。然而，每个Web用户可能有不同的背景、兴趣和目的，他们往往对需要挖掘的主题只有一个粗浅的认识，提不出明确的目标。这就需要Web挖掘具有较强的智能性，不断跟踪Web用户的兴趣，简单明了地提供挖掘结果。2）半结构化的数据源。每个Web站点都是异构的数据源，使得整个互联网可以看做一个巨大的异构数据库环境。针对这种数据集合进行数据挖掘，首先必须解决Web站点之间异构数据的集成问题。此外，还要解决Web上的数据查询问题，否则对这些数据进行分析、集成、处理就无从谈起。由此，就需要定义一个半结构化数据模型，并借助半结构化模型提取技术，自动从现有数据中提取半结构化模型（刘智等，2001）。

前言

知识，作为社会经济活动的基本要素，已成为社会经济发展的基本资源和根本动力，人类因此进入知识经济和知识社会的新时代。但是，新的知识环境在促进社会发展和人类进步的同时，也让我们置身于知识生态的重重矛盾之中：一方面知识存量激增，并呈爆炸性增长；另一方面知识稀缺严重，人们生活在知识的海洋中，却难以获得所需要的知识。一方面知识产生速度加快，新知识源源不断；另一方面知识老化加速，知识更新周期缩短。一方面知识广泛传播，互联网络提供了知识传播的新途径，跨越了知识扩散的时空障碍；另一方面数字鸿沟日趋明显，城乡差距、地区差异、人群差别影响知识的扩散。因此，如何有效地管理和开发利用知识资源，更好地满足人们日益增长和迫切的知识需求，是人类自我完善和自我发展的需要，更是推动知识创新与知识经济发展的前提和基础，是社会全面协调和科学发展的关键。知识管理与知识服务诞生于知识经济逐渐兴起、信息技术飞速发展、商业竞争日益加剧的环境中，广泛融合了信息科学、管理学、图书情报学等多学科理论与方法，形成了以“知识”为核心和研究对象的一个新的跨学科研究领域。从管理学视角，知识管理是将组织可获得的各种来源的信息转化为知识，并将知识与人联系起来的过程，强调对显性知识和隐性知识的管理与共享，利用集体的智慧提高组织的应变和创新能力；而知识服务是知识管理领域的演变进化，是随知识管理发展而延伸的概念，是新兴的服务科学、管理和工程学科（SSME）的重要分支。从图书情报视角，知识管理是信息管理的进一步发展，知识服务是信息服务的深化与拓展，知识服务的功能应建立在信息管理和知识管理的基础之上，以满足用户的知识需求和实现知识增值为目标。因此，知识管理是知识服务的基础，知识服务是知识管理的延伸，也是知识管理实现知识创新目标的有效途径。知识管理与知识服务也逐渐成为图书情报学、管理学和信息科学等多学科关注的重要领域和研究热点。

后记

本书是对我的博士学位论文的进一步深化与拓展。在华中科技大学管理学院学习期间，我秉承“明德厚学、求是创新”的校训，在恩师张金隆教授的严格指导下，顺利完成学业并获益良多。张老师以其渊博的知识、敏锐的学术洞察力和崇尚自由创新的学术思想指引我在广阔的学术空间自由探索，其严谨的治学态度、认真求实的工作作风、正直谦逊的为人之道无不使我耳濡目染。在学术上，张老师对我谆谆教导，精心培养；在工作和生活上，张老师给予我极大关心和帮助。我博士学位论文的完成，更是倾注了张老师大量的心血和无尽的关怀。论文从选题、构思、撰写直至最后定稿都得到了张老师的精心指导和热心帮助。我对张老师的谢意是难以言表的，今后勤奋的工作和良好的业绩可能是对张老师辛勤培养的最好回报。同时我非常感谢我求学生涯的另一位恩师——我硕士阶段的导师——华中师范大学信息管理系主任王学东教授。王老师将我引入信息管理科学的殿堂，并为我之后的研究奠定了坚实的基础。而且，在攻读博士学位期间，王老师在学习、工作和生活上都给予我极大的支持与帮助。在博士学位论文的选题、撰写和答辩过程中，武汉大学经济与管理学院谭力文教授，华中科技大学管理学院黎志成教授、蔡淑琴教授、鲁耀斌教授、胡斌教授都曾给予我热情的帮助和指导，在此表示诚挚的谢意！另外，要特别感谢同窗好友——卢新元博士、陈涛博士、张东风博士、谢刚博士、丛国栋博士、周光勇博士、邵祖峰博士、杜育华博士、周涛博士、叶彩虹博士等的无私帮助。衷心感谢《知识管理与知识服务研究》丛书主编王伟军教授，不仅为本书的出版提供了宝贵的机会，而且在本书的撰写过程中提出了很多指导性的建议。感谢父母的养育之恩，他们的爱是我前进的动力。同时，深深感谢我的妻子邓卫华女士，她既是我生活中的忠实伴侣，也是我的良师益友，正是她默默无闻的奉献，才使我顺利完成本书的撰写。

内容概要

易明,1978年生，湖北黄冈人。华中科技大学管理科学与工程专业博士，武汉大学图书馆、情报与档案管理在站博士后。华中师范大学信息管理系副教授，情报学专业硕士生导师。主要从事web挖掘与信息服务、社会网络与知识管理等领域的研究。主持教育部人文社会科学研究青年基金项目1项、全国高等学校教学研究中心项目1项，参加国家级、省部级项目6项。主编出版《客户关系管理》、《电子商务概论》等教材。在《中国图书馆学报》、《情报学报》，《中国管理科学》、《图书情报工作》、《情报科学》、《现代图书情报技术》等国内刊物公开发表论文30余篇，l收录1篇，ISTP收录3篇。编者简介：王伟军,华中师范大学教授、博士生导师。现任华中师范大学信息管理系副主任；华中师范大学教学委员会委员、学位评定委员会管理学分会委员、知识管理与知识服务研究中心主任；兼任教育部高等学校图书馆学科教学指导委员会委员，中国索引学会常务理事，中国社会科学情报学会理事，中国信息经济学会电子商务专业委员会副秘书长，湖北省电子商务学会常务理事、副秘书长，湖北省信息学会常务理事；《情报科学》、《评价与管理》、《湖北信息化》等杂志的编委和《情报资料工作》学术指导委员会委员；曾担任第七届IFIP电子商务、电子服务与电子社会（13E2007）国际会议主席。2007年入选教育部新世纪优秀人才支持计划。一直从事信息资源管理、知识管理与知识服务，电子商务等领域的教学和研究工作；公开发表学术论文80余篇，出版著作嘟（含合著）；近5年来，主持或参与国家自然科学基金、国家社会科学基金，国家“863”计划、教育部高等学校学科创新引智计划、教育部人文社会科学研究和武汉市社会科学基金等10多项课题；曾荣获湖北省社会科学优秀成果一等奖和三等奖、湖北省自然科学优秀学术论文三等奖，第六届全国多媒体课件大赛优秀奖、武汉市社会科学优秀科研成果奖等多项奖励。

书籍目录

总序序前言第1章  绪论  1.1  本书研究背景  1.2  本书研究目的与意义    1.2.1  本书研究目的    1.2.2  本书研究意义  1.3  国内外研究现状    1.3.1  Web挖掘研究现状    1.3.2  个性化信息推荐研究现状  1.4  本书研究内容与方法    1.4.1  本书研究内容    1.4.2  本书的研究方法第2章  研究对象及问题界定  2.1  数据挖掘与Web挖掘    2.1.1  数据挖掘    2.1.2  Web挖掘  2.2  个性化与个性化信息推荐    2.2.1  个性化相关概念    2.2.2  个性化信息推荐  2.3  基于Web挖掘的个性化信息推荐流程    2.3.1  数据输入    2.3.2  数据预处理    2.3.3  模式分析    2.3.4  在线推荐第3章  基于Web挖掘的个性化信息推荐机理  3.1  全信息理论与信息过程模型    3.1.1  全信息理论    3.1.2  信息过程模型  3.2  基于全信息的“点击流”信息运动过程模型    3.2.1  “点击流”的含义    3.2.2  “点击流”信息的层次    3.2.3  “点击流”信息运动过程模型  3.3  “点击流”信息运动视角的个性化信息推荐模型    3.3.1  “点击流”信息获取——捕获Web用户点击行为    3.3.2  “点击流”信息认知——提取Web用户点击行为模式    3.3.3  “点击流”信息再生——产生个性化信息推荐策略    3.3.4  “点击流”信息施效——实施个性化信息推荐策略  3.4  基于Web挖掘的个性化信息推荐的方法体系    3.4.1  语法层次的个性化信息推荐方法    3.4.2  语义层次的个性化信息推荐方法    3.4.3  语用层次的个性化信息推荐方法第4章  语法层次的Web用户偏好分析与推荐  4.1  语法层次的Web用户偏好分析与推荐框架  4.2  Web交易事务集的提取    4.2.1  数据过滤    4.2.2  用户识别    4.2.3  会话识别    4.2.4  路径补充  4.3  基于Web交易事务聚类的Web用户偏好分析    4.3.1  交易事务的表示    4.3.2  交易事务聚类    4.3.3  导出Web使用文档    4.3.4  生成Web用户偏好页面集  4.4  基于频繁Web页面集的Web用户偏好视图    4.4.1  提取频繁Web页面集    4.4.2  生成Web用户偏好视图第5章  基于网络书签的个性化信息推荐方法  5.1  Web 2.0与网络书签    5.1.1  Web 2.0概述    5.1.2  网络书签概述  5.2  基于网络书签的社团结构划分    5.2.1  社团结构的定义    5.2.2  网络书签系统模型    5.2.3  基于CPM算法的社团结构划分    5.2.4  实验分析  5.3  网络书签系统中基于社团结构的个性化信息推荐    5.3.1  社团内基于协作过滤的个性化信息推荐    5.3.2  社团间基于“信息桥”的个性化信息推荐    5.3.3  实验分析第6章  语义层次的基于Web文本挖掘的推荐规则获取与匹配  6.1  基于Web文本挖掘的推荐规则获取与匹配模型  6.2  基于向量空间模型的Web文本表示    6.2.1  Web页面的净化    6.2.2  Web文本特征粒度的选择    6.2.3  Web文本特征的提取    6.2.4  Web文本特征的选择  6.3  基于Web特征词条聚类的文本挖掘    6.3.1  交易事务的特征词条表示    6.3.2  基于特征词条的交易事务聚类    6.3.3  导出Web文本文档    6.3.4  生成匹配文档  6.4  Web文本关联规则获取与匹配    6.4.1  基于关联规则的频繁Web特征词条集    6.4.2  生成匹配文档第7章  整合Web语义知识的个性化信息推荐方法  7.1  整合Web语义知识的个性化信息推荐概述    7.1.1  整合Web语义知识的个性化信息推荐框架    7.1.2  整合Web语义知识的个性化信息推荐方法的优势  7.2  本体的基本理论    7.2.1  本体的概念与特点    7.2.2  本体的分类    7.2.3  本体的建模元语    7.2.4  本体的表示方法  7.3  Web领域本体的构建    7.3.1  本体构建的一般方法    7.3.2  Web领域本体的构建过程  7.4  基于Web领域本体的个性化信息推荐方法    7.4.1  导出语义层次的Web使用文档    7.4.2  生成个性化推荐Web页面集第8章  基于社会化标签的Web用户兴趣建模  8.1  社会化标签概述    8.1.1  社会化标签的起源    8.1.2  社会化标签系统模型    8.1.3  社会化标签系统的特点与不足  8.2  基于社会化标签聚类的Web用户兴趣模型    8.2.1  基于社会化标签的向量空间模型    8.2.2  基于密度聚类的Web用户兴趣模型    8.2.3  实验分析  8.3  基于社会化标签网络的Web用户兴趣模型    8.3.1  社会网络分析概述    8.3.2  Web用户的社会化标签网络模型    8.3.3  基于SNA的社会化标签网络分析    8.3.4  Web用户兴趣建模与个性化信息推荐第9章  语用层次的Web用户效用函数构建  9.1  引言    9.1.1  语用层次的个性化信息推荐方法的核心问题    9.1.2  面向此次Web站点访问的Web用户效用函数构建方法  9.2  基于用户反馈的效用函数    9.2.1  用户反馈    9.2.2  基于用户显式反馈的效用函数    9.2.3  基于用户隐式反馈的效用函数  9.3  基于贝叶斯网络学习机制的效用函数构建    9.3.1  贝叶斯网络    9.3.2  基于一般Web用户效用函数的先验贝叶斯网络构建    9.3.3  基于一般Web用户效用函数的贝叶斯网络学习参考文献后记

编辑推荐

《基于Web挖掘的个性化信息推荐》由科学出版社出版。

作者简介

《基于Web挖掘的个性化信息推荐》内容简介：基于Web挖掘的个性化信息推荐是解决当前互联网“信息过载”问题的重要手段之一。《基于Web挖掘的个性化信息推荐》在继承国内外相关研究成果的基础上，建立了基于Web挖掘的个性化信息推荐模型，并构建了语法层次、语义层次和语用层次的个性化信息推荐方法体系。然后，从语法层次的角度，利用Web使用挖掘方法研究了Web用户偏好分析与推荐问题，并借鉴复杂网络中的社团结构划分方法，提出了基于网络书签的个性化信息推荐方法；从语义层次的角度，提出了基于Web文本挖掘的推荐规则获取与匹配方法，分析了基于Web领域本体的个性化信息推荐方法，研究了基于社会化标签的Web用户兴趣建模方法；从语用层次的角度，利用用户反馈和贝叶斯网络理论讨论了Web用户效用函数的构建方法。

《基于Web挖掘的个性化信息推荐》内容丰富、应用性强，可供信息管理、计算机应用等领域从事相关研究的专家学者、工程技术人员及高等院校相关专业教师、研究生参考使用。

图书封面

基于Web挖掘的个性化信息推荐下载

发布书评

精彩短评 (总计17条)

186页还卖48，抢钱啊
太次了，一片博士论文也比这个详细。看不如看片综述，以后看书要注意，以为是第一本关于推荐的综述就买了，结果就悲剧了，
老师推荐的书，慢慢看吧。。。。。
对我个人来说，没啥用处，可能是我要求太高了吧，哎，又浪费自己的钱了..
是某某的博士论文...
应该是一个博士生的毕业论文改写来的，不过看了也算略微了解这个领域
书读完了，需要仔细研读
朋友说不错，对他有用
写得不咋地
国内学术成果的典范，内容很多，东拼西凑
还没看呢，翻了一下，有不少算法介绍，属于稍微专业点的书吧！得有点基础！
太难懂了，理论性好强，有种文绉绉的感觉。。。大致读了一下前三章，后面的实在看不下去了，想想觉得现在可能也用不到就没再看了。。。可能以后知识丰富一点了会读起来轻松点。
像一本教科书理论性表现的太强有点生涩可读性差硬着头皮浏览了一遍
垃圾…不值得读
其实是个博士论文的整理，对于在WEB挖掘基础阶段的人很有帮助，从中能得到很好的指引
书还不错，不过理论还是蛮多的，比较适合数学好点的人吧
工作需要买的，希望能给我带来一些新的想法，送货速度还算迅速。
基本上是参考消息的风格，而且，在介绍中重点突出的“点击流”，并非作者自称的首创，至少在2009年的web数据挖掘里已经有提到过2004年的某些文献也提出过同样的概念何况作者的书里头对这个点击流具体应用也没说出个道道出来，至于选择的K-means算法理由更显牵强且缺乏实用的可行性

基于Web挖掘的个性化信息推荐

发布书评

精彩短评 (总计17条)

类似图书

相关图书推荐