求真百科欢迎当事人提供第一手真实资料,洗刷冤屈,终结网路霸凌。

数据科学工程实践查看源代码讨论查看历史

事实揭露 揭密真相
跳转至: 导航搜索

来自 孔夫子网 的图片

数据科学工程实践》,副标题:用户行为分析与建模 AB实验 SQLFlow,谢梁 著,出版社: 机械工业出版社。

截至2022年,机械工业出版社年出版新书近2700种,年引进和输出版权总量近800种,产品横跨科技出版、教育出版、大众出版三大板块,覆盖机械、电工电子、汽车、建筑、计算机、经管、心理[1]、生活、科普、艺术设计、文创等十多个专业领域,以及高等教育[2]职业教育、技能教育等不同教育层次。

内容简介

这是一本将数据科学三要素——商业理解、量化模型、数据技术全面打通的实战性着作,是来自腾讯、滴滴、快手等一线互联网企业的数据科学家、数据分析师和算法工程师的经验总结,得到了SQLFlow创始人以及腾讯、网易、快手、贝壳找房、谷歌等企业的专家一致好评和推荐。

全书三个部分,内容相对独立,既能帮助初学者建立知识体系,又能帮助从业者解决商业中的实际问题,还能帮助有经验的专家快速掌握数据科学的Z新技术和发展动向。内容围绕非实验环境下的观测数据的分析、实验的设计和分析、自助式数据科学平台3大主题展开,涉及统计学、经济学、机器学习、实验科学等多个领域,包含大量常用的数据科学方法、简洁的代码实现和经典的实战案例。

  • 1部分(第 1~6 章) 观测数据的分析技术

讲解了非实验环境下不同观测数据分析场景所对应的分析框架、原理及实际操作,包括消费者选择偏好分析、消费者在时间维度上的行为分析、基于机器学习的用户生命周期价值预测、基于可解释模型技术的商业场景挖掘、基于矩阵分解技术的用户行为规律发现与挖掘,以及在不能进行实验分析时如何更科学地进行全量评估等内容。

  • 二部分(第7~9章)实验设计和分析技术

从 A/B 实验的基本原理出发,深入浅出地介绍了各种商业场景下进行实验设计需要参考的原则和运用的方法,尤其是在有样本量约束条件下提升实验效能的方法及商业场景限制导致的非传统实验设计。

第三部分(*10~12章) 自助式数据科学平台SQLFlow

针对性的讲解了开源的工程化的自助式数据科学平台SQLFlow,并通过系统配置、黑盒模型的解读器应用、聚类分析场景等案例帮助读者快速了解这一面向未来的数据科学技术。

参考文献