高可用性的HDFS

当前位置:首页 > 计算机网络 > 程序设计 > 高可用性的HDFS

出版社:清华大学出版社
出版日期:2012-5
ISBN:9787302282587
作者:文艾,王磊
页数:371页

内容概要

文艾,解放军理工大学讲师,7年Linux分布式系统开发经验,完成科研项目10余项,发表学术论文9篇,获得部级科技进步奖3项。自2008年关注云计算方向以来,参与完成了《云计算》教材编写,负责首届全国高校教师暑期云计算培训班实验课程教学,与国内外知名企业合作,完成多项云计算科研项目及培训任务,其中《面向3G视频监控的云存储系统》在2009年中国首届云计算大会上作了大会演示。对GFS、HDFS、MooseFS等云存储系统的运行原理和实现机制进行过深入研究,此外感兴趣的方向还包括分布式智能视频处理,目前的主要研究方向为云计算高可用性及云存储系统。王磊,南京云创存储科技有限公司云计算工程师,专注于分布式平台下任务调度和可靠性。发表多篇分布式环境下任务调度和可靠性论文。深度分析Hadoop源代码,熟悉运行机制和原理,掌握HDFS具体流程细节,深入理解分布式计算理论及Hadoop的运行机制和原理,熟悉HDFS、MapReduce和Hbase的具体实现方式。在HDFS、MapReduce的数据一致性方面和故障恢复上也有深入研究,并提供高效自动恢复方案。参与开发了多个与Hadoop相关的大型项目和产品,热衷于改进Hadoop代码以及研究如何提高Hadoop的可靠性。

书籍目录

目录
第1章 HDFS HA及解决方案 1
1.1 HDFS系统架构 2
1.2 HA定义 3
1.3 HDFS HA原因分析及应对措施 4
1.3.1 可靠性 4
1.3.2 可维护性 5
1.4 现有HDFS HA解决方案 5
1.4.1 Hadoop的元数据备份方案 6
1.4.2 Hadoop的SecondaryNameNode方案 7
1.4.3 Hadoop的Checkpoint ode方案 7
1.4.4 Hadoop的BackupNode方案 8
1.4.5 DRDB方案 9
1.4.6 FaceBook的AvatarNode方案 10
1.5 方案优缺点比较 10
第2章 HDFS元数据解析 13
2.1 概述 14
2.2 内存元数据结构 14
2.2.1 INode 15
2.2.2 Block 16
2.2.3 BlockInfo和DatanodeDescriptor 17
2.2.4 小结 17
2.2.5 代码分析——元数据结构 18
2.3 磁盘元数据文件 24
2.4 Format情景分析 27
2.5 元数据应用场景分析 45
第3章 Hadoop的元数据备份方案 47
3.1 运行机制分析 48
3.1.1 NameNode启动加载元数据情景分析 50
3.1.2 元数据更新及日志写入情景分析 64
3.1.3 Checkpoint过程情景分析 73
3.1.4 元数据可靠性机制 109
3.1.5 元数据一致性机制 110
3.2 使用说明 110
第4章 Hadoop的Backup Node方案 113
4.1 Backup Node概述 114
4.1.1 系统架构 115
4.1.2 使用原则 115
4.1.3 优缺点 116
4.2 运行机制分析 116
4.2.1 启动流程 117
4.2.2 元数据操作情景分析 141
4.2.3 日志池(journal spool)机制 151
4.2.4 故障切换机制 156
4.3 实验方案说明 158
4.4 构建实验环境 158
4.4.1 网络拓扑 159
4.4.2 系统安装及配置 160
4.4.3 安装JDK 170
4.4.4 虚拟机集群架设 171
4.4.5 NameNode安装及配置 173
4.4.6 Backup Node安装及配置 173
4.4.7 Data Node安装及配置 174
4.4.8 Clients安装及配置 175
4.5 异常解决方案 175
4.5.1 异常情况分析 175
4.5.2 NameNode配置 175
4.5.3 Backup Node配置 182
4.5.4 Data Node配置 185
4.5.5 NameNode宕机切换实验 189
4.5.6 NameNode宕机读写测试 196
第5章 AvatarNode运行机制 205
5.1 方案说明 206
5.1.1 系统架构 206
5.1.2 思路分析 208
5.1.3 性能数据 209
5.2 元数据分析 209
5.2.1 类FSNamesystem 210
5.2.2 类FSDirectory 210
5.2.3 AvatarNode的磁盘元数据文件 211
5.3 AvatarNode Primary启动过程 211
5.4 AvatarNode Standby启动过程 217
5.4.1 AvatarNode的构造方法 217
5.4.2 Standby线程的run()方法 218
5.4.3 Ingest线程的run()方法 220
5.4.4 Ingest线程的ingestFSEdits ()方法 220
5.4.5 Standby线程的doCheckpoint()方法 221
5.5 用户操作情景分析 223
5.5.1 创建目录情景分析 223
5.5.2 创建文件情景分析 231
5.6 AvatarNode Standby故障切换过程 240
5.7 元数据一致性保证机制 242
5.7.1 元数据目录树信息 242
5.7.2 Data Node与Block数据块映射信息 243
5.8 Block更新同步问题 246
5.8.1 问题描述 246
5.8.2 结论 246
5.8.3 源码分析 246
第6章 AvatarNode使用 253
6.1 方案说明 254
6.1.1 网络拓扑 254
6.1.2 操作系统安装及配置 255
6.2 使用Avatar打补丁版本 255
6.2.1 Hadoop源码联机Build 256
6.2.2 Hadoop源码本地Build 262
6.2.3 NFS服务器构建 264
6.2.4 Avatar分发与部署 267
6.2.5 Primary(namenode0)节点配置 269
6.2.7 Data Node节点配置 276
6.2.8 Client节点配置 278
6.2.9 创建目录 279
6.2.10 挂载NFS 280
6.2.11 启动Ucarp 280
6.2.12 格式化 281
6.2.13 系统启动 281
6.2.14 检查 282
6.2.15 NameNode失效切换写文件实验 283
6.2.16 NameNode失效切换读文件实验 291
6.3 Avatar FaceBook版本的使用 294
6.3.1 Hadoop FaceBook版本安装 294
6.3.2 节点配置 295
6.3.3 启动HDFS 300
6.3.4 NameNode失效切换 302
第7章 AvatarNode异常解决方案 305
7.1 测试环境 306
7.2 Primary失效 306
7.2.1 解决方案 306
7.2.2 写操作实验步骤 307
7.2.3 改进写操作机制 313
7.2.4 读操作实验步骤 313
7.2.5 小结 317
7.3 Standby失效 317
7.4 NFS失效(数据未损坏) 317
7.4.1 解决方案 317
7.4.2 写操作实验步骤 318
7.4.3 读操作实验步骤 320
7.4.4 小结 322
7.5 NFS失效(数据已损坏) 323
7.5.1 解决方案 323
7.5.2 写操作实验步骤 324
7.5.3 读操作实验步骤 327
7.5.4 小结 330
7.6 Primary先失效,NFS后失效(数据未损坏) 331
7.6.1 解决方案 331
7.6.2 写操作实验步骤 331
7.6.3 读操作实验步骤 333
7.6.4 小结 334
7.7 Primary先失效(数据未损坏),NFS后失效(数据损坏) 335
7.7.1 解决方案 335
7.7.2 写操作实验步骤 335
7.7.3 读操作实验步骤 338
7.7.4 小结 339
7.8 NFS先失效(数据未损坏),Primary后失效 340
7.8.1 解决方案 340
7.8.2 写操作实验步骤 340
7.8.3 读操作实验步骤 342
7.8.4 小结 343
7.9 NFS先失效(数据损坏),Primary后失效(数据损坏) 344
7.9.1 解决方案 344
7.9.2 写操作实验步骤 344
7.9.3 读操作实验步骤 346
7.9.4 小结 348
7.10 实验结论 348
第8章 Cloudera HA NameNode使用 349
8.1 HA NameNode说明 350
8.2 CDH4B1版本HDFS集群配置 351
8.2.1 虚拟机安装 351
8.2.2 nn1配置 351
8.2.3 dn1~dn3配置 355
8.2.4 HDFS集群构建 358
8.3 HA NameNode配置 361
8.3.1 nn1配置 361
8.3.2 其他节点配置 365
8.4 HA NameNode使用 367
8.4.1 启动HA HDFS集群 367
8.4.2 第1次failover 368
8.4.3 模拟写操作 368
8.4.4 模拟Active Name Node失效,第2次failover 369
8.3.5 模拟新的Standby NameNode加入 370
8.5 小结 371

编辑推荐

《高可用性的HDFS:Hadoop分布式文件系统深度实践》编辑推荐:如果您是一位Hadoop集群管理维护人员,请阅读本书,它将向您展示当前主流的HDFS HA解决方案,通过文字说明和视频展示这些方案的实现机制和操作细节,使您能够在最短的时间内消化和吸收这些技术,您可以根据自己的需要选择和部署实施最合适的HA方案。如果您是一位Hadoop应用开发者,请阅读《高可用性的HDFS:Hadoop分布式文件系统深度实践》,您将会在此寻找到如何与HDFS的HA相结合,编写出更为健壮的应用程序的答案。如果您是一位分布式文件系统研发人员,请阅读《高可用性的HDFS:Hadoop分布式文件系统深度实践》,它将向您深入剖析HDFS这一最有影响力的开源云计算分布式存储系统的各种HA方案及其实现机制。如果您是一位云计算技术的爱好者,请阅读《高可用性的HDFS:Hadoop分布式文件系统深度实践》,它会从零开始,一步一步地带您掌握云计算相关技术的基本操作,并加深概念的理解,为您日后深入云计算技术打下基础。

作者简介

《高可用性的HDFS:Hadoop分布式文件系统深度实践》专注于Hadoop分布式文件系统(HDFS)的主流HA解决方案,内容包括:HDFS元数据解析、Hadoop元数据备份方案、Hadoop Backup Node方案、AvatarNode解决方案以及最新的HA解决方案Cloudrea HA Name Node等。其中有关Backup Node方案及AvatarNode方案的内容是该书重点,尤其是对AvatarNode方案从运行机制到异常处理方案的步骤进行了详尽介绍,同时还总结了各种异常情况下AvatarNode的各种处理方案。
《高可用性的HDFS:Hadoop分布式文件系统深度实践》从代码入手并结合情景分析、案例解说对HDFS的元数据以及主流的HDFS HA解决方案的运行机制进行了深入剖析,力求使读者在解决问题时做到心中有数,不仅知其然还知其所以然。
《高可用性的HDFS:Hadoop分布式文件系统深度实践》光盘包含本书部分操作的视频教程以及所有源代码、脚本等开发文件。
《高可用性的HDFS:Hadoop分布式文件系统深度实践》读者主要为云计算相关领域的研发人员、云计算系统管理维护人员,也适合作为高校研究生和高年级本科生的专业课辅助教材。

图书封面


 高可用性的HDFS下载 更多精彩书评



发布书评

 
 


精彩书评 (总计1条)

  •     首先说说这本书把,我觉得是非常烂的,一堆一堆的java源代码,里面的操作过程也是机械式的。难道这就是传说中的源码分析?就像window的文件系统是fat32,linux的是ext4一样,这里的hdfs只是可以存储在多台机器上,一个作为主用,其他作为备份,主机坏了,某个备份点可以自动切换为主节点。这个和oracle 的 dataguard非常像。大数据时代,也要用分布式的存储方式。

精彩短评 (总计62条)

  •     还没看,但是看了标题,似乎与目录内容有点出入,希望是我的错觉!
  •     还不错,赠送的光盘没有声音,真无语了,而且不能回看,你就那么喜欢exe的视频文件格式?搞得我不得不反翻录,真无语了
  •     分布式文件系统,讲的很好
  •     内容其实不多,有很多都是环境的安装和测试,不过对于我这个门外汉来说,可以快速了解一下HADOOP的高可用机制,3分。
  •     给老公买的 正学习中 印刷有点差强人意
  •     书中包含最新的HA技术,实践性很强,书中的经验总结对学习的朋友很有用。光盘的视频齐全,所有步骤和脚本都有。
  •     学习分布式存储
  •     操作范例交完善,但是理论略嫌不足,如果对HDFS设计思想和原理图做一定的分析可能效果更好.
  •     本书有深度,有内涵,把当前的热点问题HA分析的透彻,支持
  •     书是关于HA技术的几种解决方案,说得都十分仔细、生动。书的实践性很强,书中的经验总结对学习的朋友很有用。光盘的视频齐全,所有步骤和脚本都有。
  •     这一部期待的看看啊!
  •     刚开始学hadoop的时候感觉看不懂,后来对hadoop有所了解后, 想回头看HDFS的一些深入操作,拿到这本书看, 发现上当了。。。
  •     很好的东西,我喜欢
  •     还没仔细看呢,书不错,喜欢
  •     1.对HDFS元数据的理论分析清楚有深度,应该对我深入HDFS有帮助,要知道HDFS的HA可是这些机制应用的集大成者,选择它作为切入点,来深入学习HDFS应该不错。
    2.内容不错,HA的方方面面都有,可以看得出来,很多是作者实践经验的总结,而且有视频和操作细节,自学方便。
    3.排版也赞一个,读起来感觉不错
    4.是不是粗制滥造,一看内容便知道,支持作者用心写的原创好书。
  •     书有好大的味道,包装看着不行
  •     是本实践的好书
  •     不错的一本书,根据本书可以熟悉了解HDFS
  •     实践强、很实用 结合代码讲原理、剖析深入 光盘视频齐全,所有步骤和脚本都有 是本学习Hadoop的 好书
  •     这本不错,适合初学者,比较容易懂
  •     貌似是最新的关于Hadoop的技术书籍哦。经朋友推荐,发现真的不错。正好有个hadoop的培训,能赶上先熟悉一下知识。光盘里面一看都塞的满满的可见实践的内容真的不少,应该是本很好的技术书籍,希望能好好学习~
  •     新书到了没有外皮包装,后面的光盘也失踪了,已经申请退货了。
  •     讲解相当详细
  •     感觉内容不太多的样子
  •     书的质量很好,就是说的配光盘的,结果没有发现光盘,致电咨询后,立即同意退货,让我再次下单。快递第二天也就过来拿货了,继续等待第二次的货了。总体来说比较满意,主要是服务态度比较好。
  •     还可以吧,在有些扩展就好了。
  •     很好。很详细的一本书
  •     最有价值的是图,代码,少了太多的上下文了
  •     虽然不是想象中那样好,但还是可以的,这个需要了解hadoop再看
  •     比较详细,国人的书偏重应用,不过可以降低学习成本,快速应用不错
  •     我感觉这本书一般,全是操作性东西,对我老说意义不大;
  •     内容还没看,粗略翻了下,感觉代码比较多,可能比较有助于新手了解吧实践把
  •     很好,不论是入门级还是中高级 都是很好的一本参考书,针对每个版本,不同的产品都研究很全面,详细。在云计算领域,是一本值得收藏和品读的好书
  •     很好,很强大,很有用。。。。。。。
  •     对HDFS文件系统源码解析
  •     光盘有问题,读不出来。其他的还不错
  •     内容比较泛泛,语言组织混乱。什么元数据就是数据的数据,说的很不透彻还出现了好几次。。。对整个HDFS的讲解很不透彻,不适用于初学者。参考价值比较低
  •     照着源码简单解读了几种HDFS备份方式,简单看了下,没什么意思(2012.12.12京东购)
  •     有实际例子,有视频教学,很不错,想学hadoop的同学有福了
  •     从源码分析HDFS,实践理论结合
  •     hdfs的好书
  •     这书讲得不错!
  •     这本书很好呀!
  •     这个方向比较小,受众太窄,而且变化太快了,一两年后可能技术就完全不同了,写个博客挺好的,不知道为什么单独成书了。从内容上看,基本是贴代码加一些分析,架构图类图状态图之类的比较少,看起来比较费劲,不如自己看代码来的方便。
  •     可能是本身该书的定位层次稍高,偏重应用,对hdfs本身的知识深度不够。
  •     可以看着内容,深度不够。运营的人看看,还不错。
  •     比较全面,深入
  •     难道这就是传说的源码分析...,一坨一坨的java代码。
  •     还没看呢,希望能对我理解hadoop有帮助
  •     最新的HA技术、 实践强、 实用性、经验的总结 结合代码讲原理、剖析深入 光盘视频齐全,所有步骤和脚本都有
  •     活动时候买划算,迟早派的上用途
  •     对于部署hdfs文件系统进行了源码级的讲解和示范,值得一看
  •     目前还没有看,但是应该不错的
  •     实用手册+光盘;
  •     感觉内容一般, 对自己还是有些用处。
  •     简明易懂,由浅入深,很适合深入hadoop学习。
  •     这是个啥JB啊都能出书
  •     内容比较少,但是操作性还是有的,对于等不起hadoop2.0的人来说,还是很有帮助的。
  •     了解hdfs的入门教材
  •     Cookbook类型的指导书籍,入门是够用了。
  •     光盘视频齐全,所有步骤和脚本都有结合代码讲原理、剖析深入
  •     当当真给力,上午下的单晚上就收到了!深圳银捷速递的快递哥就更加给力了,让人觉得就是一个爽字了得!问:晚上你们还送啊? 答:怕白天不在家!
 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024