信息检索可视化

当前位置:首页 > 社会科学 > 图书馆学档案学 > 信息检索可视化

出版社:科学出版社
出版日期:2009-6
ISBN:9787030247438
作者:Jin Zhang
页数:233页

章节摘录

插图:广泛存在于因特网、OPAC系统、数字图书馆以及其他形式的信息检索系统中的数字信息正在以指数倍增长。每年大约要产生一百万特字节(1TB一1024GB)的数据,其中,99%的是以数字化形式存在(Keim,2001)。这些信息系统中的数据变得越来越复杂,更新速度也越来越快,在日常生活中正在被越来越多的人利用。当具有不同背景、特性、能力、喜好和目的的用户数显著增长时,用户的需求也开始变得更加多样和复杂。因此,迫切需要一种更高效的信息检索手段——这向当前信息检索系统中使用的传统方法与技术提出了挑战。在传统的信息检索系统中,信息检索主要是基于关键词查询,并且,由于用户无法控制内部匹配过程,查询过程是非连续的。传统的信息检索系统还存在一些固有缺陷:内部匹配过程对用户不透明,检索结果以线性列表的形式显示,一次可显示的结果有限,文档间的关系极少用图示展现,检索环境缺乏供用户浏览的交互机制等。这些固有缺陷使得传统的信息检索系统面对信息需求的极度复杂性与海量多维数据束手无策。当前计算机已拥有高速运算能力和巨大存储容量,进而拥有了强大的图形处理能力。这些技术与成熟的现代信息检索理论和人机交互理论相结合促生了信息可视化技术。为了克服传统信息检索系统固有的缺陷,信息可视化技术应运而生。信息可视化是一个新兴的领域,其主要目的是将信息形象化以方便与用户交互。它通过视窗、图标、菜单和定点装置提供前所未有的交互能力。当今计算机强大的图形处理能力已使得这种复杂的可视化展示成为可能。因此,用于信息组织、表示、解释和检索,并且具有直观性与交互性的新的信息可视化方法能够洞察数据集内部,获取丰富的数据关联和数据内容,挖掘数据特点。这种信息检索可视化方法使得人们能够充分发挥自己的灵活性、创造力和想象力来搜寻信息。对于各种类型用户——无论老少、无论是否有使用经验、无论是否有信息检索专业知识、无论是否懂英语——真正优秀的信息检索可视化技术都应该能够满足其需求。图像是信息表达与交流的主要工具。在人类文明进程中,它一直贯穿于人类的智力活动中。早期的可视化展示可以追溯到14世纪甚至更早。当时的宇宙图中,地球处于宇宙的中心,由分别代表四种基本元素、七大行星、黄道十二宫和月相的同心圆围绕着(cresques,1978)。基于计算机的可视化应用几乎是随着现代计算机的发明而诞生的。可是,现代图形理论却是始于定量数据的可视化展示原理及理论的提出(Tufte,1983)。

前言

飞速增长的互联网上动态、多样、异质、复杂的信息和其他信息检索系统给传统的信息检索技术和理论带来了史无前例的挑战。这些挑战使人们对信息检索提出了加强交互性、直观性、有效性等要求,也使专家们必须集中精力寻找满足用户检索相关信息的新方法。信息可视化技术可以在一个视觉的、明晰的、交互性的环境下论证数据之间的相关性,它已成为我们应对挑战的最大希望。信息可视化和信息检索有着天然的联系。事实上信息检索就像一条线一样贯穿着整个信息可视化系统。信息可视化向用户提供独特的方式去检索信息,它可以把隐藏的信息用视觉的形式呈现,并允许用户以视觉形式进行检索。浏览作为一种强有力的信息检索方式将在可视化环境中被充分应用。可视化技术给信息检索带来了希望,从信息检索的角度来看待信息可视化,最终将使信息检索和信息可视化都受益。本书从理论和实际应用方面,对信息检索可视化领域最新进展进行了体系化的阐明,评价了这个领域主要的技术和方法,说明了信息检索和信息可视化的理论关联,并介绍了信息检索可视化的主要算法和模型。本书也说明了信息检索可视化的一些重要的和普遍的问题,如在深度应用中出现的难以评价性、不精确性以及隐喻性。此外,它深度探讨了信息检索可视化在网络流量分析、网络信息搜寻、浏览等领域的理论和实际应用。在本书的结束部分,作者多角度比较了他所介绍的几个信息检索可视化模型。最后,本书探讨了信息检索可视化的重要问题和检索领域以后探索的方向。本书的读者将通过此书更好地理解信息检索可视化的现状,获悉主要学者的一些技术、理论发现和前沿进展,信息检索可视化系统实现的一些充分的、有实用价值的细节,以及这个领域的研究者所必须注意的问题。本书的结构如下:第1章介绍了信息检索可视化的一些基础问题,如为什么信息可视化技术对于信息检索非常关键;如何从查询和浏览两个方面加强信息检索;什么是基础的信息检索可视化范例;在信息检索中信息可视化的潜在应用和影响是什么;什么是信息检索可视化模型的基础程序。第2章包含了信息检索中一些基础的概念和理论。这些概念和算法,如相似性方法、信息检索模型、语词加权算法等,都是后续章节中关于信息检索可视化模型介绍的必要前提。把这些概念和理论放在一起组成一个章节不仅仅是为了避免在后续的章节中重复介绍,更是为了打好一个理论基础。

内容概要

作者:(美国)Jin Zhang 译者:夏立新 陆伟 沈吟东

书籍目录

译者序中文版的前言序前言第1章  信息检索与可视化  1.1  可视化    1.1.1  定义    1.1.2  科学可视化和信息可视化  1.2  信息检索    1.2.1  浏览与提问搜索    1.2.2  微观信息与宏观信息    1.2.3  信息空间的空间特性    1.2.4  浏览的空间特性  1.3  可视化的感知与认知    1.3.1  感知    1.3.2  认知  1.4  信息检索的可视化    1.4.1  基本原理    1.4.2  三种信息检索可视化模式    1.4.3  建立一个信息检索可视化模型  1.5  小结第2章  信息检索基础  2.1  向量空间模型  2.2  词语加权法    2.2.1  停用词    2.2.2  逆文献频率    2.2.3  萨尔顿词语加权法    2.2.4  另一个词语加权法    2.2.5  概率词语加权法  2.3  相似性方法    2.3.1  内积相似性方法    2.3.2  戴斯系数法    2.3.3  加卡德相似性方法    2.3.4  重合系数相似性方法    2.3.5  余弦相似法    2.3.6  距离相似法    2.3.7  集成角度-距离相似性方法    2.3.8  皮尔森参数γ相关性法  2.4  信息检索(评价)模型    2.4.1  基于方向的检索(评价)模型    2.4.2  基于距离的检索(评价)模型    2.4.3  椭圆检索(评价)模型    2.4.4  合取检索(评价)模型    2.4.5  析取检索模型    2.4.6  卡斯尼椭圆检索(评价)模型  2.5  聚类算法    2.5.1  非分级聚类算法    2.5.2  分级聚类算法  2.6  检索结果评价  2.7  小结第3章  多重参考点可视化模型  3.1  多重参考点  3.2  多重固定参考点模型  3.3  可移动多重参考点模型    3.3.1  原始VIBE算法描述    3.3.2  关于模型的讨论  3.4  自动旋转参考点模型    3.4.1  视觉空间的定义    3.4.2  参考点的旋转  3.5  信息检索的含义  3.6  小结第4章  基于欧几里得空间特征的可视化模型  4.1  欧几里得空间及其特征  4.2  信息检索评价模型介绍  4.3  基于距离-角度的可视化模型    4.3.1  视觉空间(visual space)的定义    4.3.2  信息检索评价模型的可视化  4.4  基于角度-角度的可视化模型    4.4.1  视觉空间的定义    4.4.2  信息检索评价模型的可视化  4.5  基于距离-距离的可视化模型    4.5.1  视觉空间的定义    4.5.2  信息检索评价模型的可视化  4.6  小结第5章  Kohonen自组织图——一种人造神经网络  5.1  神经网络介绍    5.1.1  神经网络的定义    5.1.2  神经网络的结构和特性  5.2  Kohonen自组织图    5.2.1  Kohonen自组织图结构    5.2.2  SOM算法的学习过程    5.2.3  特征图标识    5.2.4  SOM算法描述  5.3  SOM于信息检索领域的意义  5.4  小结第6章  探路者关联网络  6.1  探路者关联网络的特性/性能和描述    6.1.1  探路者关联网络的定义及说明    6.1.2  算法的描述    6.1.3  图布局法  6.2  信息检索的含义    6.2.1  作者同被引分析    6.2.2  语词关联网络    6.2.3  Hyperlink超级链接    6.2.4  探路者关联网络中的搜索  6.3  小结第7章  多维尺度法  7.1  多维尺度法简介    7.1.1  经典MDS算法    7.1.2  非计量MDS    7.1.3  计量MDS  7.2  MDS技术对信息检索的启示    7.2.1  显示对象和对象之间的距离的定义    7.2.2  MDS显示空间的开发    7.2.3  讨论  7.3  小结第8章  因特网的信息可视化  8.1  引言    8.1.1  因特网的特征    8.1.2  因特网的信息组织和显示的方法    8.1.3  因特网信息的利用    8.1.4  因特网的挑战  8.2  因特网的信息可视化    8.2.1  因特网信息结构的可视化    8.2.2  因特网信息查询的可视化    8.2.3  网络交通流量的可视化    8.2.4  联机讨论历史记录的可视化  8.3  小结第9章  信息可视化中的歧义性  9.1  信息可视化的歧义性及其影响    9.1.1  信息可视化中歧义性的原因    9.1.2  歧义信息可视化的影响  9.2  信息检索可视化模型中的歧义性分析    9.2.1  欧几里得空间特征为基础的信息模型的歧义性    9.2.2  基于多参考点的信息可视化模型中的歧义性    9.2.3  探路者网络中的歧义性    9.2.4  SOM中的歧义化    9.2.5  多维排列的歧义化  9.3  小结第10章  隐喻在信息可视化中的意义  10.1  隐喻的定义、基本要素和特征  10.2  隐喻的认知基础  10.3  心智模型、隐喻和人机交互    10.3.1  人机交互中的隐喻    10.3.2  心智模型    10.3.3  HCI中的心智模型  10.4  信息可视化检索中的隐喻    10.4.1  使用隐喻的基本原理    10.4.2  隐喻性信息检索可视化环境  10.5  隐喻应用的步骤和原则    10.5.1  隐喻应用的步骤    10.5.2  设计良好的隐喻视觉信息检索环境的建议  10.6  小结第11章  信息检索可视化的基准和评价标准  11.1  信息检索可视化的评价  11.2  基准和评价标准    11.2.1  评价标准的影响因素    11.2.2  开发评价基准的原则    11.2.3  评价标准的四种类型    11.2.4  基准的描述  11.3  小结第12章  后记  12.1  简介  12.2  各种可视化模型的比较  12.3  问题  12.4  小结参考文献中英文术语对照表

编辑推荐

《信息检索可视化》的读者将通过此书更好地理解信息检索可视化的现状,获悉主要学者的一些技术、理论发现和前沿进展,信息检索可视化系统实现的一些充分的、有实用价值的细节,以及这个领域的研究者所必须注意的问题。

作者简介

《信息检索可视化》从理论和实际应用方面,对信息检索可视化领域最新进展进行了系统的阐述,集中介绍了信息检索可视化的基本原理及其结构、方法和算法,较为系统地比较了多重参考点可视化模型(MRPBM)、基于欧几里得空间特征的可视化模型(ESCBM)、探路者关联网络(PFNET)、多维尺度模型(MDS)、自组织图模型(SOM)等五种主要的信息检索可视化模型,讨论了信息可视化系统的评估及信息可视化系统设计中人的行为,分析了信息可视化中的一些特有的歧义现象,并提出解决办法。
通过《信息检索可视化》,读者可以了解和掌握信息检索可视化的现状,获悉主要学者的一些技术、理论发现和前沿进展,信息检索可视化系统实现的一些充分的、有实用价值的细节,以及研究这个领域所必须注意的问题。
《信息检索可视化》可作为信息科学、计算机科学及相关学科的研究人员、从业者、系统设计者和分析者、网络管理员、图书管理员、教育者和研究生的参考资料。

图书封面


 信息检索可视化下载



发布书评

 
 


精彩短评 (总计4条)

  •     正在做聚类的可视化展示,这本书帮助很大。
  •     不知道老外怎么想的,虽然模型是可视化的基础,不过只是模型数学公式不至于叫visualization吧
  •     内容不错,曾经听过一次作者的一次讲座
  •     | G354.4 /Z321
 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024