DevOps故障排除

出版日期:2014-4
ISBN:9787111462823
作者:Kyle Rankin
页数:184页

内容概要

Kyle Rankin 高级系统管理员、DevOps开发工程师、美国北湾地区Linux用户组主席.他著有《The Official Ubuntu ServerBook》、《Knoppix Hacks》和《Ubuntu Hacks》等书,不仅是《Linux Journal》杂志享誉盛名的专栏作家,还是《PC Magazine》杂志、TechTarget网站等多家媒体的撰稿人。Rankin经常出席SCALE(南加州Linux展会)、OSCON(O'Reilly开源大会)、Linux World Expo、Penguicon以及一些 Linux用户组会议,并就开源软件发表演讲。
王东明 毕业于武汉大学,之后开始从事网络游戏服务器开发。先后开发过端游和页游服务器,现就职于某外企,从事游戏开发工作。业余时间喜欢技术类书籍翻译以及移动游戏开发。
王飞 拥有武汉大学学士学位,中国科学技术大学硕士学位。现就职于某国企互联网部,从事网络运维开发工作.对于Linux服务器运维有丰富的经验,对”大流量,高并发”的应用场景有着深刻的理解,擅长自动化运维工具的开发与使用,尤其是对报警相关流程的自动化有着独到的见解。
刘洁 拥有北京邮电大学硕士学位.资深Web开发工程师和系统工程师,现就职于某搜索公司,专注于计算广告系统和移动搜索算法研究相关工作,工程实践经验极为丰富。

书籍目录

译者序
前言
第1章 故障排除的最佳实践
1
1.1 划分问题空间
2
1.2 协同工作时的良好沟通
3
1.2.1 电话会议
3
1.2.2 直接对话
4
1.2.3 电子邮件
5
1.2.4 实时聊天室
6
1.2.5 备用沟通方法
7
1.3 首选快速、简单的测试,而不是缓慢、复杂的测试
7
1.4 多尝试过去的解决方案
8
1.5 记录问题和解决方案
9
1.6 了解改动
11
1.7 了解系统如何工作
12
1.8 谨慎使用internet
13
1.9 抵制重启
14
第2章章服务器为什么这么慢?耗尽了cpu、ram和磁盘i/o资源
15
2.1 系统负载
16
2.2 使用top命令解决负载问题
18
2.2.1 了解top命令的输出
19
2.2.2 解决高用户时间的问题
21
2.2.3 解决内存不足的问题
22
2.2.4 解决高i/o等待时间问题
24
2.3 问题发生后的高负载处理
27
2.3.1 配置sysstat
27
2.3.2 查看cpu统计信息
28
2.3.3 查看ram统计信息
29
2.3.4 查看磁盘统计信息
29
2.3.5 查看之前的统计信息
30
第3章 为什么系统无法启动?解决启动问题
32
3.1 linux启动流程
32
3.1.1 bios
33
3.1.2 grub和linux启动载入程序
33
3.1.3 内核与初始ram磁盘
35
3.1.4 /sbin/init
35
3.2 bios启动顺序
42
3.3 修复grub
43
3.3.1 没有grub提示
44
3.3.2 阶段1.5 grub提示
45
3.3.3 配置错误的grub提示
46
3.3.4 从活动系统中修复grub
46
3.3.5 通过恢复磁盘修复grub
47
3.4 禁止启动界面
47
3.5 无法挂载根文件系统
48
3.5.1 根内核参数
48
3.5.2 根设备更改
49
3.5.3 根分区损坏或失效
52
3.6 无法挂载二级文件系统
52
第4章章为什么磁盘无法写入?解决磁盘满或者磁盘损坏的问题
53
4.1 磁盘满
53
4.1.1 保留区块
54
4.1.2 找到占用空间最大的目录
55
4.2 节点不足
57
4.3 文件系统只读
58
4.4 修复损坏的文件系统
58
4.5 修复软raid
60
第5章 服务器宕机了?追踪网络问题的根源
63
5.1 服务器a不能和服务器b通信
64
5.1.1 客户端或者服务器问题
64
5.1.2 链路接通了吗
64
5.1.3 接口是否启用
66
5.1.4 是否连通本地网络
66
5.1.5 dns是否工作正常
68
5.1.6 是否可以路由到远程主机
70
5.1.7 远程端口是否开放
71
5.1.8 在本地测试远端主机
72
5.2 网络速度较慢的故障排除
74
5.2.1 dns的问题
74
5.2.2 通过traceroute查找网络缓慢的原因
75
5.2.3 使用iftop查看带宽使用情况
76
5.3 抓取数据包
79
5.3.1 使用tcpdump
80
5.3.2 使用wireshark
83
第6章 为什么主机名无法解析?解决dns服务器的问题
87
6.1 dns客户端故障排除
88
6.1.1 未配置名称服务器或者无法访问名称服务器
89
6.1.2 丢失查询路径或者名称服务器问题
91
6.2 dns服务器故障排除
91
6.2.1 了解dig的输出
92
6.2.2 跟踪dns查询
95
6.2.3 递归名称服务器的问题
97
6.2.4 什么情况下没有执行更新
101
第7章 为什么无法收发邮件?追踪邮件问题
112
7.1 追踪邮件请求
113
7.2 了解邮件头信息
116
7.3 邮件发送的问题
118
7.3.1 客户端无法与外部邮件服务器通信
119
7.3.2 出站邮件服务器不允许转发
123
7.3.3 出站邮件服务器无法与目标服务器通信
124
7.4 接收邮件的问题
127
7.4.1 telnet测试无法连接
129
7.4.2 telnet可以连接,但消息却被拒绝了
130
7.4.3 研究邮件日志
130
第8章 网站宕机了?追踪web服务器问题
133
8.1 服务器是否正在运行
134
8.1.1 远程端口是否开放
134
8.1.2 在本地测试远程主机
135
8.2 使用命令行测试web服务器
137
8.2.1 使用curl测试web服务器
137
8.2.2 使用telnet测试web服务器
139
8.3 http状态码
141
8.3.1 1××信息状态码
141
8.3.2 2××成功状态码
141
8.3.3 3××重定向状态码
142
8.3.4 4××客户端错误状态码
143
8.3.5 5××服务器错误状态码
144
8.4 分析web服务器的日志
145
8.5 获取web服务器统计数据
149
8.6 解决常见的web服务器问题
154
8.6.1 配置问题
154
8.6.2 权限问题
155
8.6.3 web服务器性能迟缓或不可用
157
第9章 为什么数据库这么慢?追踪数据库问题
161
9.1 查找数据库日志
162
9.1.1 mysql
162
9.1.2 postgressql
162
9.2 数据库还在运行吗
163
9.2.1 mysql
164
9.2.2 postgressql
165
9.3 获得数据库度量值
166
9.3.1 mysql
166
9.3.2 postgressql
168
9.4 识别查询缓慢的问题
171
9.4.1 mysql
171
9.4.2 postgressql
173
第10章 这是硬件问题!诊断常见的硬件问题
174
10.1 硬盘驱动器无法工作
175
10.2 测试内存错误
178
10.3 网卡故障
180
10.4 服务器过热
181
10.5 电源供电故障
183

作者简介

devops是一组过程、方法与系统的统称,用于促进开发者、质量保证人员(qa)以及系统管理员之间的沟通、协作与整合。在devops团队中,虽然大家一直强调团队合作,但由于没有相同的故障排除技术,在遇到问题时,每个人往往限于自己的传统职责,要等到其他人诊断完成后方能开始工作。这样,尽管采用了devops原则,企业的效率也并不高.本书面向devops团队,通过系统讲解常见的linux故障排除技术,帮助开发者更准确地追踪系统负载加重的原因,让qa人员在产品发布前更好地诊断问题,系统管理员对自己的诊断更有把握。
《devops故障排除:linux服务器运维最佳实践》首先介绍了故障排除中要掌握的基本方法和原则,然后针对linux系统中的常见问题,逐个分析故障原因并给出故障排除方法,这些问题包括服务器运行缓慢、系统无法启动、不能写入磁盘、服务器宕机、主机名无法解析、web服务器宕机、数据库运行缓慢等,最后还简单介绍了常见的硬件问题。
《devops故障排除:linux服务器运维最佳实践》内容全面,结构清晰,适合开发者、qa人员和系统管理员学习参考。


 DevOps故障排除下载 更多精彩书评



发布书评

 
 


精彩书评 (总计1条)

  •     话说纸质书实在是不想买,主要是没地方放。不过这书收到的时候明显是遭受到虐待,也罢,我只看内容,不是用来收藏的。话说 @守住每一天 的《Puppet实战》还等待精读,前面大概的看了一下,发现半本书的内容已经接触过了,后半部分当时工作忙,草草地读了一下,还没有实践,估计得等下一个搞Linux的人来之后才有空。《DevOps故障排除:Linux服务器运维最佳实践》(后面简称《DevOps》)这本书通读完后,发现实际上是给开发人员的运维书,也就是Dev学习Ops过程的书籍。看的时候进行了下角色转换,确实是对Dev的角色很有帮助,但仅限于Linux下的故障排除——估计Windows这玩意在DevOps的世界里混的不行吧,^_^ 。很羡慕《DevOps》一书作者所在的公司,全部都更换Linux,我真期待公司也能全面Linux化,这样交流的人就多了,成长也快了,不再会有孤军奋战的感觉了——尼玛让我一个人搞一个领域,还要当开发测试运维管理使用的角色,我实在是扛不住啊。由于上面吐槽的境况,《DevOps》中的部分命令我实际上是很少用到或没用到的,所以这次看书的时候也顺道看了一下。感觉我也就搜索能力强了,记性不大好,很多东西用到时才学习,估计也是这环境逼的……书中章节的安排也是由浅入深,或者说是由表象到原理的方式,将开发人员常见的故障一步步进行解析、处理,并提供了一些常见的应对方式。书中的故障近期就遇到了三起,但都及时搞定了。由此可以看出作者对章节的安排是经过深思熟虑的。内容就不细说了,有兴趣的Dev人员赶紧看看吧,除了部分语句的翻译个人有其他意见外,都还是比较清晰易懂的。由于需要内部传阅,所以发现翻译问题没有及时标注,个人认为都是为保持汉语纯正而导致的一些问题(有些词拜托是可以不翻译的,各位译者翻译过来后反而可能帮倒忙),还有几句我需要还原成原文才能明白其意思。DevOps,看似简单,但实际挺难,不仅需要个人的能力、经验和技巧,更需要整个团队的配合。

精彩短评 (总计17条)

  •     仔细看了前半部分,后面的一扫而过。20160422
  •     读锁加太久了,是释放的时候了。我这种初级人员看不太懂,也读的很无趣,运维方面还是要找些更加浅显的东东。
  •     运维
  •     估计是我的水平已经超过或者达到本书所讲内容了,感觉收获不大
  •      本书短小精悍,推理严谨,非常合适入门,因为书比较薄,难免内容不够深入,特别是谈及web服务器的那章将得过于简单了,但一般的运帷也是够了,权当是科普和知识得总结,还是值得一读
  •     很浅显的常识普及
  •     一般吧
  •     内容基本上是Linux、数据库、网络等的具体的故障排除,与DevOps的实践基本关系不大。
  •     这本书让我对系统管理员以及devops有了全新的,全面的,现代的理解。如果说一本好的书会让人想去了解作者本人,那么这本书确实做到了,我爱这本书!这薄薄的一本根本不够啊!!
  •     很实用。嗯。
  •     适合刚入行的盆友阅读
  •     DevOps是时代趋势,做一个简单的工具书还是不错的。概略一下,好简单的工具书。
  •     其实我觉得还不错,某个前任公司离职的时候送给小同事了
  •     写的简单易读,可只有ops啊
  •     太浅了..入门运维可以读读
  •     对于对于Linux系统有点儿了解的人来说,应该这本书还可以的,排查问题的思路也不错;对于我这样和Linux打交道6-7年的人来说,稍微浅了一点,不过还是学到了一些平时不太关注到的故障排查方法。
  •     dev去了解ops的内容,#第二章真心不错#
 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024