開啟主選單

求真百科

來自 孔夫子網 的圖片

Spark權威指南》,出版社: 中國電力出版社,張岩峰 譯。

書籍對於人類原有很重大的意義,但,書籍不僅對那些不會讀書的人是毫無用處,就是對那些機械地讀完了書還不會從死的文字中引申活的思想[1]的人也是無用的。 —— 烏申斯基[2]

目錄

內容簡介

通過本書你將了解到如何使用、部署和維護Apache Spark開源集群計算框架。本書由Spark的創始人所撰寫,重點介紹Spark*版本的新功能和新點。本書將Spark功能分解為若干獨立主題來進行全面介紹。

本書的主要內容有:

大數據技術和Spark概述。

通過實例學習DataFrame、SQL、Dataset等Spark的核心API。

了解Spark的低級API實現,包括RDD以及SQL和DataFrame的執行過程。

了解Spark如何在集群上運行。

Spark集群和應用程序的調試、監控、和調優。

學習Spark強大的流處理引擎——結構化流處理。

學習MLlib並了解如何應用它解決包括分類、推薦,以及其他多種實際問題。

參考文獻

  1. 思想指導人生,豆丁網,2013-01-15
  2. 烏申斯基的教育思想,中公教育,2021-09-19