數據科學工程實踐
《數據科學工程實踐》,副標題:用戶行為分析與建模 AB實驗 SQLFlow,謝梁 著,出版社: 機械工業出版社。
截至2022年,機械工業出版社年出版新書近2700種,年引進和輸出版權總量近800種,產品橫跨科技出版、教育出版、大眾出版三大板塊,覆蓋機械、電工電子、汽車、建築、計算機、經管、心理[1]、生活、科普、藝術設計、文創等十多個專業領域,以及高等教育[2]、職業教育、技能教育等不同教育層次。
目錄
內容簡介
這是一本將數據科學三要素——商業理解、量化模型、數據技術全面打通的實戰性着作,是來自騰訊、滴滴、快手等一線互聯網企業的數據科學家、數據分析師和算法工程師的經驗總結,得到了SQLFlow創始人以及騰訊、網易、快手、貝殼找房、谷歌等企業的專家一致好評和推薦。
全書三個部分,內容相對獨立,既能幫助初學者建立知識體系,又能幫助從業者解決商業中的實際問題,還能幫助有經驗的專家快速掌握數據科學的Z新技術和發展動向。內容圍繞非實驗環境下的觀測數據的分析、實驗的設計和分析、自助式數據科學平台3大主題展開,涉及統計學、經濟學、機器學習、實驗科學等多個領域,包含大量常用的數據科學方法、簡潔的代碼實現和經典的實戰案例。
- 1部分(第 1~6 章) 觀測數據的分析技術
講解了非實驗環境下不同觀測數據分析場景所對應的分析框架、原理及實際操作,包括消費者選擇偏好分析、消費者在時間維度上的行為分析、基於機器學習的用戶生命周期價值預測、基於可解釋模型技術的商業場景挖掘、基於矩陣分解技術的用戶行為規律發現與挖掘,以及在不能進行實驗分析時如何更科學地進行全量評估等內容。
- 二部分(第7~9章)實驗設計和分析技術
從 A/B 實驗的基本原理出發,深入淺出地介紹了各種商業場景下進行實驗設計需要參考的原則和運用的方法,尤其是在有樣本量約束條件下提升實驗效能的方法及商業場景限制導致的非傳統實驗設計。
第三部分(*10~12章) 自助式數據科學平台SQLFlow
針對性的講解了開源的工程化的自助式數據科學平台SQLFlow,並通過系統配置、黑盒模型的解讀器應用、聚類分析場景等案例幫助讀者快速了解這一面向未來的數據科學技術。
參考文獻
- ↑ 談心理健康教育對學生的重要性 ,搜狐,2020-04-12
- ↑ 2020中國高等教育十大關鍵詞,搜狐,2020-12-28