《大数据架构商业之路:从业务需求到技术方案》书评

出版日期:2016-5-9
ISBN:9787111535286
作者:[中] 黄申
页数:299页

大数据解决方案技术入门书籍

刚拿到书时,看到书名感觉像是一本讲商业与产品的书,一开始我关键的关键词是“大数据”、“商业”、“业务需求”,但实际阅读完书籍,可能就会与最初的印象有所不一样,在我的理解中,作者的主线更接近于**“大数据——技术方案——架构——业务需求——商业”** ,这本书实际上的核心正是在于**“技术方案”**这一核心上。“大数据(Big Data)”概念提出人实际上给大家展现了一个很宏大的数据应用蓝图。事实上,基于数据的采集与商业应用,从IT软件业的早期就已经有人在持续研究了,但直到互联网发展到云计算时代,数据的基础才真正有了海量存储与复杂分析的意义。所以大家**不应该把大数据当作一个工具或产品来思考,而更应该将其当作一种思维与理念的革新**,在当前或不久的将来,数据将与我们的日常生活、工作息息相关。而构建大数据技术解决方案可以说是实现上述一切分析与应用的基础,正由于其思维与理念的新颖,当前有能力为自己的企业搭建这样的基础服务的团队实际上是少之又少,书里花了比较多的篇幅宏观地介绍了整个大数据解决方案涉及的技术方案与特性,这对原先不了解这领域的人会有比较好的帮助,通过一些基础概念和技术发展,能够概括的了解到大数据解决方案涉及的方方面面,不过我觉得前面的概念性篇幅过多了点(估计有2/3章节)。相信其中涉及到的一些技术,单拉出来都能形成一个独立的解决方案,作者在书中谈到了许多技术可行性方案,这对一些业内资深人员来说,可能稍显粗浅了些,而对一些新手,则可能犯“选择综合症”,对于在不同的时期与条件下,究竟应该如何选择可能无法做出有效的决定。作者在书中提到技术解决方案时,基本上跳过了商业技术方案的建议,大都是基于开源项目的推荐,其实我觉得对于商业方案,也可以适当涉及,毕竟不是所有企业都有一个有实力的技术团队来自己寻找开源项目搭建自有大数据系统,如果有一些小型的、费用不高并且功能上基本能满足一些早期企业的要求的商业方案,对大家来说也是一种短期性的选择。在数据收集上,作者介绍的两个开源系统:Apache Nutch和Heritrix都是基于外部的链式网页抓取,个人建议还可以利用Google Analytics或者国内的一些流量统计分析软件做部分数据收集源的替代工具。大数据存储上,我们可以看到传统的关系型数据库已经无法满足大数据应用,这就需要我们在存储工具上做出改变,业内还是有不少新型的选择,比如MongoDB与dBase等,而分布式系统是当前应对云计算与海量数据处理的关键解决方案。而在大数据的应用上,作者专门针对商品搜索和推荐系统做了介绍,不过感觉还不够深入,整体上还是偏向于技术性的思考。作者在书中列举了一些技术性逻辑处理的案例,显然作者在这方面有着比较丰富的经验,不过这对一部分人来说可能只能起到提示的作用,更多的系统的逻辑设计,可能就需要大家自己去摸索了。不过对于作者在书中所展现出的数据处理的框架,个人还是比较认同的。从数据的**收集——存储——处理——挖掘——应用**,这为我们呈现出了构建完整大数据解决方案需要涉及的相关领域。在作者的介绍中,各领域内实际上都有不必的技术工具可供选择,当然对于产品人员来说,技术工具是哪个不是关键,可能更关心背后的运作机理。对IT主管来说,可能就是很有效的决策帮助了。综合来看,这本书给人的定位更像是大数据技术解决方案的白皮书,在向大家陈述大数据的技术应用时,也很好的向大家介绍了整体的解决思路,对于想要全面了解大数据解决框架的人来说,是一个不错的选择,尤其是对那些大数据技术主管和相应的大数据产品经理来说。


 大数据架构商业之路:从业务需求到技术方案下载


 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024