Spark SQL内核剖析
读书评论:
-
momo01-29看完再对比着看Spark 1.0的代码,感觉就清晰多了
-
理论上不存在11-09内容不错,讲得很细。语言组织的也不错。值得推荐。
-
?Want12-29有收获,对 SQL 原理有了更深刻的认识
-
肥仔水08-11可以当2.0版本的工具书。一些细节说的都非常详细,难得的国人佳作。
-
sigsegv04-12Catalyst部分讲的还不错(Logical/Physical Plan),但是后面讲codegen的地方感觉就是翻译spark文档。。。
-
核动力蜗牛12-26目前市面上,专门分析讲解Spark SQL的书并不多,包括网上的资料都比较单薄不成系统。该书算是比较系统的介绍Spark SQL的书籍。本书的篇幅不多,不过对于没有数据库原理基础的读者看起来还是有点费劲的。先说说该书一些可圈可点之处:1. 本书的叙述思路还是比较清晰的。2. 书中代码不多,比较简洁。图例比较多,比较好理解。不过,也发现了一些问题:1. 该书感觉像是由几个人分别撰写一部分,然后拼在一起的,明显有些基础内容是有重叠的。而且,撰写逻辑和讲述方式前后不太一致。2. 正如我之前提到的,该书对于没有数据库原理的读者,是不太友好的(前几章还可以,有先脱离Spark SQL介绍一下ANTLR4,比较好理解)。3. 在书的最后还介绍了腾讯的TDW,感觉完全没有必要。
-
沈析02-20书是好书,但我看不懂。。。
-
麦小孩12-29三星半吧,入门是够了,内容讲解还算清楚
-
没有昵称05-23挺hard core的书,还是需要带着需求去看,如果实习的时候能看看这本书,做Spark SQL物化视图应该会很有很多新的启发。
-
doubin07-11用心之作,废话不多,可惜例子不够深入
-
Mr-Lush01-19看来还得多得多学点知识
-
三七李06-26虽然大部分看不懂但还是学到不少东西… 感觉写的挺好,是我不行,翻完了,有需要回来重读…
-
硅胶鱼06-09可以看出作者是肚里有货的,但是这书还是有国内源码分析类书的通病,重源码轻原理和动机。讲的比较散,看得比较累。
-
漂来漂去06-091. 内容详实,从Parser、Optimizer到Codegen都有涉及2. 没有贴太多代码,画的图倒还不错3. 不足之处在于,仍是从代码到原理,而更符合思维逻辑的是从Why到How;分析的深度有限,例如如何实现Join谓词下推、等价类推导并没有展开4. 感觉书的行文逻辑略奇怪,不断讲解这个class是什么意思、那个method是什么,却没有一个连贯的逻辑来分析从why到how的过程