開啟主選單

求真百科

數據分析師養成寶典

來自 孔夫子網 的圖片

數據分析師養成寶典》,程顯毅 著,出版社: 機械工業出版社。

機械工業出版社成立於1950年,是建國後國家設立的第一家科技出版社,前身為科學技術出版社,1952年更名為機械工業出版社[1]。機械工業出版社(以下簡稱機工社)由機械工業信息研究院作為主辦單位,目前隸屬於國務院國資委[2]

目錄

內容簡介

在數據為主導的現-在,對於一種已經成型的模型,「怎麼用」通常不是問題,用個軟件或者編幾行程序就能得到結果了,問題一般都出在模型「什麼時候用」和「用完了,然後呢」。《數據分析師養成寶典》就集中討論後面兩件事情。 《數據分析師養成寶典》共27章,分為業務理解篇(*1~4章)、指標設計篇(第5~7章)、數據建模篇(第8~16章)、價值展現篇(*17~19章)和實戰進階篇(*20~27章)。業務理解篇的目的是讓讀者建立正確的思維觀,理解數據,熟悉業務;指標設計篇學習把數據轉換為專家數據的一些技巧;數據建模篇以R語言為計算平台實施數據分析全過程;價值展現篇主要討論如何撰寫有價值的數據分析報告;實戰進階篇通過對8個經典案例的分析,使讀者能夠把學到的思維方法、實施工具應用到解決實際問題中,把數據變成價值。 本書可供數據科學相關技術人員閱讀,也可作為高等院校數據科學相關專業的教材或培訓教材,以及數據分析愛好者的參考讀物。

目錄

如何使用本書 第0章說在前面的話 0.1大數據分析案例 0.2數據分析 0.2.1數據分析不同於信息化系統 0.2.2數據分析不同於統計分析 0.2.3數據分析不同於數據挖掘 0.2.4數據分析不同於數據管理 0.2.5數據分析不同於商業智能 0.2.6數據分析的內容 0.3數據分析師 0.3.1什麼是數據分析師 0.3.2基本要求 0.4數據分析過程如何使用本書

第0章說在前面的話

0.1大數據分析案例

0.2數據分析

0.2.1數據分析不同於信息化系統

0.2.2數據分析不同於統計分析

0.2.3數據分析不同於數據挖掘

0.2.4數據分析不同於數據管理

0.2.5數據分析不同於商業智能

0.2.6數據分析的內容

0.3數據分析師

0.3.1什麼是數據分析師

0.3.2基本要求

0.4數據分析過程

0.4.1業務理解

0.4.2指標設計

0.4.3數據建模

0.4.4分析報告

業務理解篇

  • 1章正確的思維觀

1.1數據思維

1.2統計思維

1.2.1統計學

1.2.2描述

1.2.3概括

1.2.4分析

1.3邏輯思維

1.3.1上取/下鑽思維

1.3.2求同/求異思維

1.3.3抽離/聯合思維

1.3.4離開/接近思維

1.3.5層次思維

  • 2章理解數據

2.1數據是什麼

2.2數據所依存的背景

2.3數據維度

2.4數據敏感

2.5數據質量

2.6理解數據要注意的問題

2.6.1不要對*美數據的盲目執着

2.6.2小樣本數據也能做數據分析

第3章理解業務

3.1全局了解——業務模型

3.2動態了解——流程模型

3.3靜態了解——數據模型

3.4動靜結合——關鍵業務分析

3.5數據業務化

第4章理解用戶

4.1由粗到細,從宏觀到微觀

4.2由少到多,收集不同層次的需求

4.3數據分析師對理解用戶需求的思考

4.3.1如何用需求分析明確產品目標?

4.3.2數據分析師理解用戶需求應該具備的基本素養

4.3.3如何根據用戶行為去驅動產品?

指標設計篇

第5章數據準備

5.1數據探索

5.1.1缺失值分析與處理

5.1.2異常值分析與處理

5.1.3不一致數據分析

5.2數據整理

5.2.1規範化

5.2.2數據選擇

5.2.3數據歸約

5.2.4數據變換

5.3數據集成

5.3.1通過向量化重構數據

5.3.2為數據添加新變量

5.3.3數據透視表

5.3.4列聯表

5.3.5數據整合

5.3.6分組計算

第6章數據指標

6.1指標和維度

6.2特徵工程

6.2.1特徵工程作用

6.2.2特徵設計

6.2.3特徵選擇

6.2.4特徵提取

6.3指標設計基本方法

6.3.1生成用於判別的變量

6.3.2生成離散變量

6.3.3業務標籤化

6.4典型業務指標設計

6.4.1零售店鋪數據分析指標

6.4.2電商數據分析指標

第7章數據認知

7.1認知數據的平均水平和波動情況

7.2認知數據的分布

7.3利用相關係數理解數據之間的關係

7.4通過對比認知數據

7.5通過多維交叉來深入認知數據

7.6周期性分析

7.7貢獻度分析

7.8因子分析

數據建模篇

第8章神經網絡

8.1模型原理

8.2進階指導

第9章回歸分析

9.1模型原理

9.2進階指導

  • 10章聚類分析

10.1模型原理

10.2進階指導

  • 11章關聯分析

11.1模型原理

11.2進階指導

  • 12章決策樹

12.1模型原理

12.2進階指導

  • 13章隨機森林決策樹

13.1模型原理

13.2進階指導

  • 14章自適應選擇決策樹

14.1模型原理

14.2進階指導

  • 15章SVM

15.1模型原理

15.2進階指導

  • 16章建模指導

16.1建模要注意的問題

16.2R語言中建模常用包

16.3數據分析模型的原理和應用場景

價值展現篇

  • 17章如何寫好數據分析報告

17.1數據的價值

17.1.1收入

17.1.2支出

17.1.3風險

17.1.4參照系

17.2講故事

17.2.1數據講故事的四大要點

17.2.2阿里指數能告訴你……

17.3如何寫報告

17.3.1寫作原則

17.3.2報告的類型和分析能力

17.3.3報告的細節

17.4報告的結構

17.4.1標題

17.4.2背景與目標

17.4.3項目說明

17.4.4分析思路

17.4.5分析主體

17.4.6總結與建議

17.5文字表達

17.5.1突出關鍵信息

17.5.2避免囉嗦的表達

17.5.3站在讀者角度

17.5.4不帶主觀臆斷

17.6分析過程

17.6.1樣本選擇

17.6.2方法實施

17.7注意事項

  • 18章數據可視化

18.1什麼是數據可視化

18.2數據可視化的作用

18.3可視化建議

18.4科學與藝術的結合

18.5可視化細節

18.6R語言繪圖

18.6.1低水平繪圖命令

18.6.2高水平繪圖命令

18.6.3交互式繪圖命令

18.7圖形適用場景

  • 19章數據分析報告製作工具

19.1knitr包

19.1.1安裝knitr

19.1.2Markdown語法

19.1.3報告製作

19.2rmarkdown包

19.2.1創建R Markdown

19.2.2R Markdown文本處理

19.2.3插入代碼塊

19.2.4結果的輸出

實戰進階篇

  • 20章校園網中推薦者的推薦價值分析

20.1業務理解

20.2指標設計

20.3描述性分析

20.4模型分析

20.5分析報告

  • 21章上市企業財務報表分析與ST預測

21.1業務理解

21.2指標設計

21.3描述性分析

21.4模型分析

21.5分析報告

  • 22章為什麼銷售會減少——驗證性分析

22.1業務理解

22.2指標設計

22.3描述性分析

22.4結論與建議

  • 23章什麼樣的顧客會選擇離開——探索性分析

23.1業務理解

23.2指標設計

23.3描述性分析

23.4結論與建議

  • 24章哪種廣告的效果更好——假設檢驗

24.1業務理解

24.2數據建模

24.3模型分析

24.4結論與建議

  • 25章如何獲得更多的用戶——多元回歸分析

25.1業務理解

25.2數據建模

25.3模型分析

25.4結論與建議

  • 26章航空公司顧客價值分析——聚類

26.1業務理解

26.2指標設計

26.3模型構建

26.4模型評價

26.5結論與建議

  • 27章竊電用戶行為分析——決策樹

27.1業務理解

27.2簡單指標設計

27.3描述性分析

27.4複雜指標設計

參考文獻