Spark權威指南檢視原始碼討論檢視歷史
《Spark權威指南》,出版社: 中國電力出版社,張岩峰 譯。
書籍對於人類原有很重大的意義,但,書籍不僅對那些不會讀書的人是毫無用處,就是對那些機械地讀完了書還不會從死的文字中引申活的思想[1]的人也是無用的。 —— 烏申斯基[2]
內容簡介
通過本書你將了解到如何使用、部署和維護Apache Spark開源集群計算框架。本書由Spark的創始人所撰寫,重點介紹Spark*版本的新功能和新點。本書將Spark功能分解為若干獨立主題來進行全面介紹。
本書的主要內容有:
大數據技術和Spark概述。
通過實例學習DataFrame、SQL、Dataset等Spark的核心API。
了解Spark的低級API實現,包括RDD以及SQL和DataFrame的執行過程。
了解Spark如何在集群上運行。
Spark集群和應用程序的調試、監控、和調優。
學習Spark強大的流處理引擎——結構化流處理。
學習MLlib並了解如何應用它解決包括分類、推薦,以及其他多種實際問題。