大数据处理框架Apache Spark设计与实现

读书评论:
  • 杉木
    06-16
    一本很不错的介绍Spark实现原理的书,适合有一定Spark基础的童鞋,让你对Spark知其然更知其所以然。推荐一读!
  • 思寇特牌搬砖工
    10-15
    相当不错,原理讲得很好,没有贴代码,可惜差了点调度部分
  • 芦蒿芦蒿
    10-18
    对大数据处理框架的思路和实现都有相当清晰的阐述,感觉很有帮助,只是调度部分少了点。
  • 某某某
    12-13
    价格略高,但是讲原理还是很清晰的,虽然我未必全部都懂得。
  • 风空之枫
    06-17
    蛮短的,不包括 Spark SQL 部分。前三章有点啰嗦,4-8该讲的基本 cover 了,但是感觉有点旧。总的来说扫一遍就行,不是很推荐
  • 我霸天君不服
    05-12
    有的地方写的有点啰嗦,总的来说写的很详细很清晰。缺少spark sql相关的内容
  • momo
    09-24
    还在读,从设计思想的理念出发,去谈spark等大数据计算框架为什么要这么设计,对整个框架和流程的理解非常有帮助。比《xx实战》这种纯讲应用和操作的书有用多了,大赞
  • 谁都别拦着我
    10-11
    真是国内少有的条理清晰图文详实
  • 阿里阿里巴巴
    07-27
    详略得当,值得一读,作者对技术细节很有洞见,解答了我很多困惑
  • Copperfield
    08-02
    不是简简单单的官网翻译,讲的很深入,能看到作者独特的研究
  • 甜点猪
    08-14
    书确实写的好。本身大数据计算框架的核心是计算思想,所以这本书从框架的各个方面甚至优化细节的设计初衷做了深入阐述,难能可贵的是讲解的还很通俗易懂。另外,看这本书最好是有一些mapreduce和分布式框架基础。
  • Rayarrow
    08-21
    内容的风格很像统计学习方法,书很薄,言简意赅,鲜有废话,而且条理清晰。对于许多问题的分析,都用蓝字标出优点、缺点等这些结构化的信息,不愧是搞大数据的。而且这本书是全彩的,图画得非常细致用心,花花绿绿的颜色一目了然,比等面积的文字可是要花费更多的精力,读者却能少花很多精力。作为多年的Hadoop、Bigflow、Spark SQL用户,总是站在应用层的角度,对于低层甚是不熟,遇到奇怪的任务失败问题只能盲目地重启大法。对于有一定使用经验的人来说,这本书读起来很轻松,但信息量却一点都不少,尤其是Shuffle和缓存写得很细致、精彩,读完之后底层原理已入门了。而对于开发者,第三章对算子的介绍也很细致,比当年看的三方教程不知道高哪里去了。作者还会engage读者,提出的问题很多时候就是读者所想。
  • 三七李
    06-24
    还以为会讲代码,实际上是讲设计,写挺好的,我基本不会spark也好像看懂了(
  • 不欺售欺
    06-13
    还不错吧,不厚,配图也很丰富。
  • Miumiu之
    12-11
    讲了重点的shuffle、cache、memory management、fault tolerance,图文并茂;每章最后的小结也写得好
  • 12ycli
    03-04
    看了这书两遍的我,给部门大佬们讲了Spark的原理
  • 梦呓小子
    09-30
    一本能夯实 Spark 基础知识的好书。
  • SakamataZ
    07-23
    此书起码把job,stage,task讲清楚了。shuffle,缓存,容错,内存处理也面面俱到,总之spark入门看这本就好了。但是实践的部分不多,还是要sparkui结合极客时间之类的看下。
  • 牛晋
    12-22
    这书才看一半就忍不住打五星
  • compaqFan
    05-08
    读完才发现spark好像没有特别多的东西,其实是很多没有讲到吧,哈哈哈