求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

變更

前往: 導覽搜尋

数据分析师养成宝典

增加 7,697 位元組, 1 個月前
创建页面,内容为“《'''数据分析师养成宝典'''》,程显毅 著,出版社: 机械工业出版社。 机械工业出版社成立于1950年,是建国后国家设立…”
《'''数据分析师养成宝典'''》,程显毅 著,出版社: 机械工业出版社。

机械工业出版社成立于1950年,是建国后国家设立的第一家科技[[出版社]],前身为科学技术出版社,1952年更名为机械工业出版社<ref>[https://www.maigoo.com/maigoo/6296cbs_index.html 中国十大出版社-出版社品牌排行榜],买购网</ref>。机械工业出版社(以下简称机工社)由[[机械工业信息研究院]]作为主办单位,目前隶属于国务院国资委<ref>[http://www.cmpbook.com/about 企业简介],机械工业出版社</ref>。

==内容简介==

在数据为主导的现-在,对于一种已经成型的模型,“怎么用”通常不是问题,用个软件或者编几行程序就能得到结果了,问题一般都出在模型“什么时候用”和“用完了,然后呢”。《数据分析师养成宝典》就集中讨论后面两件事情。 《数据分析师养成宝典》共27章,分为业务理解篇(*1~4章)、指标设计篇(第5~7章)、数据建模篇(第8~16章)、价值展现篇(*17~19章)和实战进阶篇(*20~27章)。业务理解篇的目的是让读者建立正确的思维观,理解数据,熟悉业务;指标设计篇学习把数据转换为专家数据的一些技巧;数据建模篇以[[R语言]]为计算平台实施数据分析全过程;价值展现篇主要讨论如何撰写有价值的数据分析报告;实战进阶篇通过对8个经典案例的分析,使读者能够把学到的思维方法、实施工具应用到解决实际问题中,把数据变成价值。 本书可供数据科学相关技术人员阅读,也可作为高等院校数据科学相关专业的教材或培训教材,以及数据分析爱好者的参考读物。

==目录==

如何使用本书 第0章说在前面的话 0.1大数据分析案例 0.2数据分析 0.2.1数据分析不同于信息化系统 0.2.2数据分析不同于统计分析 0.2.3数据分析不同于数据挖掘 0.2.4数据分析不同于数据管理 0.2.5数据分析不同于商业智能 0.2.6数据分析的内容 0.3数据分析师 0.3.1什么是数据分析师 0.3.2基本要求 0.4数据分析过程如何使用本书

第0章说在前面的话

0.1大数据分析案例

0.2数据分析

0.2.1[[数据]]分析不同于信息化系统

0.2.2数据分析不同于统计分析

0.2.3数据分析不同于数据挖掘

0.2.4数据分析不同于数据管理

0.2.5数据分析不同于商业智能

0.2.6数据分析的内容

0.3数据分析师

0.3.1什么是数据分析师

0.3.2基本要求

0.4数据分析过程

0.4.1业务理解

0.4.2指标设计

0.4.3数据建模

0.4.4分析报告

业务理解篇

*1章正确的思维观

1.1数据思维

1.2统计思维

1.2.1统计学

1.2.2描述

1.2.3概括

1.2.4分析

1.3逻辑思维

1.3.1上取/下钻思维

1.3.2求同/求异思维

1.3.3抽离/联合思维

1.3.4离开/接近思维

1.3.5层次思维

*2章理解数据

2.1数据是什么

2.2数据所依存的背景

2.3数据维度

2.4数据敏感

2.5数据质量

2.6理解数据要注意的问题

2.6.1不要对*美数据的盲目执着

2.6.2小样本数据也能做数据分析

第3章理解业务

3.1全局了解——业务模型

3.2动态了解——流程模型

3.3静态了解——数据模型

3.4动静结合——关键业务分析

3.5数据业务化

第4章理解用户

4.1由粗到细,从宏观到微观

4.2由少到多,收集不同层次的需求

4.3数据分析师对理解用户需求的思考

4.3.1如何用需求分析明确产品目标?

4.3.2数据分析师理解用户需求应该具备的基本素养

4.3.3如何根据用户行为去驱动产品?

指标设计篇

第5章数据准备

5.1数据探索

5.1.1缺失值分析与处理

5.1.2异常值分析与处理

5.1.3不一致数据分析

5.2数据整理

5.2.1规范化

5.2.2数据选择

5.2.3数据归约

5.2.4数据变换

5.3数据集成

5.3.1通过向量化重构数据

5.3.2为数据添加新变量

5.3.3数据透视表

5.3.4列联表

5.3.5数据整合

5.3.6分组计算

第6章数据指标

6.1指标和维度

6.2特征工程

6.2.1特征工程作用

6.2.2特征设计

6.2.3特征选择

6.2.4特征提取

6.3指标设计基本方法

6.3.1生成用于判别的变量

6.3.2生成离散变量

6.3.3业务标签化

6.4典型业务指标设计

6.4.1零售店铺数据分析指标

6.4.2电商数据分析指标

第7章数据认知

7.1认知数据的平均水平和波动情况

7.2认知数据的分布

7.3利用相关系数理解数据之间的关系

7.4通过对比认知数据

7.5通过多维交叉来深入认知数据

7.6周期性分析

7.7贡献度分析

7.8因子分析

数据建模篇

第8章神经网络

8.1模型原理

8.2进阶指导

第9章回归分析

9.1模型原理

9.2进阶指导

*10章聚类分析

10.1模型原理

10.2进阶指导

*11章关联分析

11.1模型原理

11.2进阶指导

*12章决策树

12.1模型原理

12.2进阶指导

*13章随机森林决策树

13.1模型原理

13.2进阶指导

*14章自适应选择决策树

14.1模型原理

14.2进阶指导

*15章SVM

15.1模型原理

15.2进阶指导

*16章建模指导

16.1建模要注意的问题

16.2R语言中建模常用包

16.3数据分析模型的原理和应用场景

价值展现篇

*17章如何写好数据分析报告

17.1数据的价值

17.1.1收入

17.1.2支出

17.1.3风险

17.1.4参照系

17.2讲故事

17.2.1数据讲故事的四大要点

17.2.2阿里指数能告诉你……

17.3如何写报告

17.3.1写作原则

17.3.2报告的类型和分析能力

17.3.3报告的细节

17.4报告的结构

17.4.1标题

17.4.2背景与目标

17.4.3项目说明

17.4.4分析思路

17.4.5分析主体

17.4.6总结与建议

17.5文字表达

17.5.1突出关键信息

17.5.2避免啰嗦的表达

17.5.3站在读者角度

17.5.4不带主观臆断

17.6分析过程

17.6.1样本选择

17.6.2方法实施

17.7注意事项

*18章数据可视化

18.1什么是数据可视化

18.2数据可视化的作用

18.3可视化建议

18.4科学与艺术的结合

18.5可视化细节

18.6R语言绘图

18.6.1低水平绘图命令

18.6.2高水平绘图命令

18.6.3交互式绘图命令

18.7图形适用场景

*19章数据分析报告制作工具

19.1knitr包

19.1.1安装knitr

19.1.2Markdown语法

19.1.3报告制作

19.2rmarkdown包

19.2.1创建R Markdown

19.2.2R Markdown文本处理

19.2.3插入代码块

19.2.4结果的输出

实战进阶篇

*20章校园网中推荐者的推荐价值分析

20.1业务理解

20.2指标设计

20.3描述性分析

20.4模型分析

20.5分析报告

*21章上市企业财务报表分析与ST预测

21.1业务理解

21.2指标设计

21.3描述性分析

21.4模型分析

21.5分析报告

*22章为什么销售会减少——验证性分析

22.1业务理解

22.2指标设计

22.3描述性分析

22.4结论与建议

*23章什么样的顾客会选择离开——探索性分析

23.1业务理解

23.2指标设计

23.3描述性分析

23.4结论与建议

*24章哪种广告的效果更好——假设检验

24.1业务理解

24.2数据建模

24.3模型分析

24.4结论与建议

*25章如何获得更多的用户——多元回归分析

25.1业务理解

25.2数据建模

25.3模型分析

25.4结论与建议

*26章航空公司顾客价值分析——聚类

26.1业务理解

26.2指标设计

26.3模型构建

26.4模型评价

26.5结论与建议

*27章窃电用户行为分析——决策树

27.1业务理解

27.2简单指标设计

27.3描述性分析

27.4复杂指标设计

==参考文献==
[[Category:040 類書總論;百科全書總論]]
272,376
次編輯