Pandas数据预处理详解查看源代码讨论查看历史
《Pandas数据预处理详解》,增田秀人 著,陈欢 译,出版社: 中国水利水电出版社。
中国水利水电出版社有限公司(China Water & Power Press)是中央级科技出版社[1]。其前身是1956年元旦成立的水利出版社。1993年被中宣部、新闻出版署评选为首批15家“全国优秀出版单位”之一[2]。
内容简介
Python 因其拥有强大的第三方软件库,广泛应用在人工智能开发、科学计算和数据分析 中。而 pandas 就是一款基于 NumPy 的解决 Python 数据分析任务的软件库。在机器学习和数 据科学中,因为很少有数据可以直接使用,所以对数据进行预处理就成为必不可少的工作。
《Pandas 数据预处理详解》就利用数据处理必需的 pandas 库,从 pandas 基本操作、数据结构, 到 pandas 将执行的各种任务,如汇总统计信息、检查缺失值 / 异常值 / 重复数据以及合并和分 组数据等,通过简单易懂的示例,对预处理的基础知识和各种预处理方法进行了透彻讲解。学 完本书,读者将能够顺利执行各种机器学习和数据分析任务。特别适合作为机器学习工程师、 数据科学及科研工作者初学数据预处理的参考书,也适合作为案头手册,随时翻阅查看。
作者介绍
Lombard 增田 秀人Lombard公司AI战略室 室长 先后在旧金山和东南亚创业,于2017年创建了机器学习学校"codexa"。企业培训讲师,曾在xPython Meet Up &Conference 2019发表演讲。
参考文献
- ↑ 我国出版社的等级划分和分类标准,知网出书,2021-03-01
- ↑ 中国水利水电出版社有限公司简介,中国水利水电出版社