Spark:大数据集群计算的生产实践
- 书名:Spark:大数据集群计算的生产实践
- 作者: 【美】Ilya Ganelin
- 格式:PDF
- 时间:2024-07-12
- 评分:
- ISBN:9787121313646
《Spark:大数据集群计算的生产实践》涵盖了开发及维护生产级Spark应用的各种方法、组件与有用实践。全书分为6章,第1 ~ 2章帮助读者深入理解Spark的内部机制以及它们在生产流程中的含义;第3章和第5章阐述了针对配置参数的法则和权衡方案,用来调优Spark,改善性能,获得高可用性和容错性;第4章专门讨论Spark应用中的安全问题;第6章则全面介绍生产流,以及把一个应用迁移到一个生产工作流中时所需要的各种组件,同时对Spark生态系统进行了梳理。
《Spark:大数据集群计算的生产实践》不会讲述入门级内容,读者在阅读前应已具备Spark基本原理的知识。《Spark:大数据集群计算的生产实践》适合Spark开发人员、Spark应用的项目经理,以及那些考虑将开发的Spark应用程序迁移到生产环境的系统管理员(或者DevOps)阅读。
Ilya Ganelin 从机器人专家成功跨界成为一名数据工程师。他曾在密歇根大学花费数年时间研究自发现机器人(self-discovering robot),在波音公司从事手机及无线嵌入式DSP(数据信号处理)软件开发项目,随后加入Capital One 的数据创新实验室,由此进入大数据领域。Ilya是Apache Spark核心组件的活跃贡献者以及Apache Apex的提交者(committer),他希望研究构建下一代分布式计算平台。同时,Ilya还是一个狂热的面包烘焙师、厨师、赛车手和滑雪爱好者。
Ema Orhian 是一位对伸缩性算法充满激情的大数据工程师。她活跃于大数据社区,组织会议,在会上发表演讲,积极投身于开源项目。她是jaws-spark-sql-rest(SparkSQL数据仓库上的一种资源管理器)的主要提交者。Ema一直致力于...
- 上一篇: 公司法务部:揭开公司法务的面纱(第二版)
- 下一篇: 一间自己的房间
-
硅胶鱼12-30spark版本比较老,2017年出版的书,还是1.5; 内容都比较浅,偏向介绍
-
Armstrong03-11这是目前看过的对Spark介绍最完整的书,有使用技巧,还有原理分析和调优,非常值得推荐
-
2024-06-117
-
2024-06-116
-
2024-06-1110
-
2024-06-119
-
2024-06-117
-
2024-06-114
-
2024-06-117
-
2024-06-1121