打开主菜单

求真百科

Spark权威指南

来自 孔夫子网 的图片

Spark权威指南》,出版社: 中国电力出版社,张岩峰 译。

书籍对于人类原有很重大的意义,但,书籍不仅对那些不会读书的人是毫无用处,就是对那些机械地读完了书还不会从死的文字中引申活的思想[1]的人也是无用的。 —— 乌申斯基[2]

目录

内容简介

通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。本书由Spark的创始人所撰写,重点介绍Spark*版本的新功能和新点。本书将Spark功能分解为若干独立主题来进行全面介绍。

本书的主要内容有:

大数据技术和Spark概述。

通过实例学习DataFrame、SQL、Dataset等Spark的核心API。

了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。

了解Spark如何在集群上运行。

Spark集群和应用程序的调试、监控、和调优。

学习Spark强大的流处理引擎——结构化流处理。

学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。

参考文献

  1. 思想指导人生,豆丁网,2013-01-15
  2. 乌申斯基的教育思想,中公教育,2021-09-19