變更

較新編輯 →

Spark3·x大数据分析实战

增加 2,212 位元組, 3 個月前

创建页面，内容为“《'''Spark3·x大数据分析实战'''》，张伟洋著，出版社：清华大学出版社。清华大学出版社成立于1980年6月，是教育部主管…”

《'''Spark3·x大数据分析实战'''》，张伟洋著，出版社：清华大学出版社。

清华大学出版社成立于1980年6月，是教育部主管、[[清华大学]]主办的综合性大学出版社<ref>[http://www.zhongyw.com.cn/news/show-53574.html 我国出版社的等级划分和分类标准]，知网出书，2021-03-01</ref>。清华社现年出版图书、音像制品、电子出版物等近3000种，[[销售]]规模和综合实力以及在高等教育教材市场、科技图书市场、馆配图书市场占有率均名列前茅<ref>[http://www.tup.tsinghua.edu.cn/aboutus/qyjj.html 企业简介]，清华大学出版社有限公司</ref>。

==内容简介==

本书基于Spark 3.2.x版本，从Spark核心[[编程语言]]Scala讲起，涵盖了当前整个Spark生态系统主流的大数据开发技术。全书共9章，第1章讲解了Scala语言的基础知识，包括IDEA工具的使用等；第2章讲解了Spark的主要组件、集群架构原理、集群环境搭建以及Spark应用程序的提交和运行；第3～9章讲解了离线计算框架Spark RDD、Spark SQL和实时计算框架Kafka、Spark Streaming、Structured Streaming以及图计算框架GraphX等的基础知识、架构原理，同时包括常用Shell命令、API操作、内核源码剖析，并通过多个实际案例讲解各个框架的具体应用以及与Hadoop生态系统框架Hive、HBase、Kafka的整合操作。

本书通俗易懂，案例丰富，注重实操，适合Spark新手和大数据开发人员阅读，也可作为培训机构和高校大数据及相关专业的教学用书。

==作者介绍==

张伟洋，[[大数据]]领域资深专家，拥有多年互联网公司软件研发经验，曾在互联网旅游公司担任软件研发事业部经理。先后多次为中国海洋大学、曲阜师范大学、青岛理工大学等高校举行大数据专题讲座，对Hadoop及周边大数据框架ZooKeeper、Hive、HBase、Storm、Spark、Flink等有深入的研究，公众号“奋斗在IT” 的创办人。已出版《Hadoop大数据技术开发实战》《Flink大数据分析实战》等图书。

==参考文献==
[[Category:040 類書總論；百科全書總論]]

龙城悠悠

279,190

次編輯