趣玩Python·自动化办公真简单查看源代码讨论查看历史
《趣玩Python·自动化办公真简单》,关东升 著,出版社: 电子工业出版社。
电子工业出版社成立于1982年10月,是工业和信息化部直属的科技与教育出版社,每年出版新书2400余种,音像和电子出版物400余种,期刊8种,出版物内容涵盖了信息科技的各个专业分支以及工业技术、经济管理、大众生活、少儿科普[1]等领域,综合出版能力位居全国出版行业前列[2]。
内容简介
本书以数据收集→数据清洗→数据分析→数据可视化→根据数据可视化结果(即图表)做决策为脉络,介绍Python在实际工作场景中的应用,侧重于用Python解决工作中的数据处理问题,并通过实战形式讲解如何用Python实现数据收集、数据清洗、数据分析及可视化等工作。本书还详细讲解了Python自动化办公方面的内容,包括:Excel自动化、Word自动化、PPT自动化、PDF文件处理、图形图像处理和RPA(机器人流程自动化),并介绍了GUI技术和应用程序打包相关知识。本书秉承有趣、有料、好玩、好用的理念,特意设计了两个人物角色,通过这两个人物角色的轻松对话、搞笑形象及夸张动作,把复杂的技术问题讲解得深入浅出,非常适合广大读者阅读。
目录
第1章千里之行,始于足下——Python基础1
1.1Python解释器2
1.2PyCharm开发工具3
1.2.1下载和安装4
1.2.2设置PyCharm工具5
1.3第一个Python程序7
1.3.1创建项目7
1.3.2创建Python代码文件9
1.3.3编写代码10
1.3.4运行程序11
1.4文本编辑工具+Python解释器实现11
1.4.1编写代码11
1.4.2运行程序12
1.4.3代码解释13
1.5Python中的基础语法14
1.5.1标识符14
1.5.2关键字15
1.5.3变量声明15
1.5.4语句15
1.5.5代码块16
1.5.6模块16
1.6数据类型与运算符17
1.6.1数据类型17
1.6.2运算符19
1.7控制语句22
1.7.1分支语句22
1.7.2循环语句24
1.7.3跳转语句27
1.8序列28
1.8.1索引操作28
1.8.2序列切片29
1.8.3可变序列——列表30
1.8.4不可变序列——元组31
1.8.5列表推导式32
1.9集合33
1.9.1创建集合33
1.9.2集合推导式34
1.10字典34
1.10.1创建字典35
1.10.2字典推导式36
1.11字符串36
1.11.1字符串的表示方式36
1.11.2将字符串格式化38
1.11.3正则表达式39
1.12函数40
1.12.1匿名函数与lambda表达式41
1.12.2数据处理中的两个常用函数42
1.13文件操作与目录管理44
1.13.1文件操作44
1.13.2文本文件读写46
1.13.3二进制文件读写47
1.13.4os模块48
1.13.5os.path模块49
1.14异常处理机制51
1.14.1捕获异常51
1.14.2释放资源52
第2章让“虫子”帮你收集数据——网络爬虫技术56
2.1数据从哪里来——收集数据56
2.2收集股票的历史交易数据58
2.3自动爬取数据60
2.4从繁杂的HTML代码中解析数据——使用BeautifulSoup库62
2.5爬不到数据怎么办——使用Selenium工具68
2.5.1Ajax动态数据70
2.5.2使用Selenium爬取数据70
2.6有验证码怎么办74
2.6.1验证码概述74
2.6.2验证码识别74
2.6.3安装OCR引擎Tesseract75
2.6.4安装pytesseract76
2.6.5安装Pillow库77
2.6.6安装OpenCV78
2.6.7验证码识别前的图像预处理78
2.6.8验证码识别过程79
2.7实战训练:电网考试平台的验证码识别81
2.7.1配置自己的Web服务器81
2.7.2启动Web服务器82
2.7.3使用Selenium模拟登录过程82
2.8提高“虫子”的工作效率86
第3章洗一洗“脏数据”——数据清洗89
3.1数据清洗那些事儿89
3.2访问Excel文件库——xlwings库90
3.2.1xlwings库中对象的层次关系91
3.2.2打开Excel文件并读取其单元格数据91
3.2.3如何获取表格区域93
3.2.4获取表格行数和列数96
3.2.5转置表格97
3.2.6单元格默认的数据类型98
3.2.7写入单元格数据99
3.2.8设置单元格样式102
3.2.9这样遍历单元格太麻烦了104
3.2.10删除列105
3.2.11删除行106
3.2.12调用VBA宏批量删除重复的数据107
3.2.13找出格式不统一的数据110
3.3填充缺失的值111
3.3.1固定值填充112
3.3.2平均值填充113
第4章把“宝贝”收好了——数据存储115
4.1读取CSV文件116
4.2将爬取的数据保存为CSV文件117
4.3SQLite数据库118
4.4使用GUI管理工具管理SQLite数据库119
4.5sqlite3模块API121
4.6将爬取的数据保存到SQLite数据库122
4.7在数据库中查询数据124
第5章找出隐藏在数据中的“黄金屋”——数据分析126
5.1数据分析那些事儿126
5.2使用Excel进行数据分析127
5.2.1老板让我找出北京周边的房价信息127
5.2.2找出北京周边房屋面积大于120m2的小区129
5.2.3找出东城区和西城区房屋面积大于120m2的小区130
5.2.4找出有北京优选房价的小区131
5.3让“熊猫”帮我们分析数据——使用pandas库132
5.3.1Series数据结构132
5.3.2DataFrame数据结构134
5.4使用pandas库读取Excel文件136
5.4.1举个“栗子”:从Excel文件中读取全国总人口数据137
5.4.2跳过头部行和尾部行138
5.4.3当“熊猫”遇到CSV文件139
5.4.4当“熊猫”遇到SQLite141
5.4.5使用pandas库写入数据到CSV文件143
5.4.6使用pandas库写入数据到Excel文件144
5.4.7使用pandas库找出各城区有优选房价的小区145
5.4.8按照各城区的平均房价排序146
5.5数据分析与数据透视表的故事148
第6章一图抵万言——数据可视化151
6.1数据可视化那些事儿151
6.2使用Matplotlib库绘制图表152
6.2.1安装Matplotlib库152
6.2.2图表的基本构成要素152
6.2.3绘制城区优选房价柱状图153
6.2.4北京房价区间占比饼状图155
6.2.5北京各城区房价分布散点图157
6.2.6贵州茅台股票的历史成交量折线图158
6.2.7绘制股票的历史OHLC图159
6.3调用Excel绘制图表161
6.3.1绘制三维折线图161
6.3.2绘制三维簇状条形图163
第7章办公离不开的“字”处理——操作Word文件165
7.1访问Word文件库——python-docx库165
7.1.1python-docx库中的那些对象166
7.1.2打开Word文件并读取内容167
7.1.3写入数据到Word文件169
7.1.4在Word文件中添加表格171
7.1.5设置文件样式173
7.1.6修改文件样式175
7.2解决在工作中使用Word时遇到的问题176
7.2.1批量转换.doc文件为.docx文件176
7.2.2采用模板批量生成证书文件178
7.2.3批量统计文件页数和字数181
7.2.4批量转换Word文件为PDF文件183
第8章演示利器PPT——操作PPT文档186
8.1访问PowerPoint文档库——python-pptx库186
8.1.1PPT中的基本概念187
8.1.2python-pptx库中的那些对象188
8.1.3创建PPT文档189
8.1.4添加更多的幻灯片190
8.1.5在PPT幻灯片中添加表格192
8.1.6在PPT幻灯片中添加图表195
8.2解决在工作中使用PPT时遇到的实际问题197
8.2.1批量转换.ppt文档为.pptx文档197
8.2.2批量转换PPT文档为PDF文件199
第9章操作跨平台的文件格式——PDF文件201
9.1PDF文件的优势201
9.2操作PDF文件库——PyPDF2库202
9.2.1PyPDF2库中的对象202
9.2.2读取PDF文件的内容202
9.2.3拆分PDF文件204
9.2.4用更多的方法拆分PDF文件205
9.2.5合并PDF文件207
9.2.6对PDF文件批量添加水印208
9.2.7批量加密PDF文件211
9.2.8批量解密PDF文件213
9.2.9暴力破解PDF文件的密码214
9.3解析PDF文件库——pdfplumber库216
9.3.1提取PDF文件中的文本信息216
9.3.2提取PDF文件中的表格信息217
第10章有图有真相——批量处理图像文件218
10.1图像处理库——Pillow库218
10.1.1读取图像文件的信息219
10.1.2我想要png文件——批量转换图像格式221
10.1.3批量设置图像的大小222
10.2旋转图像225
10.3添加水印226
10.4生成各种各样的“码”228
10.4.1批量生成二维码228
10.4.2批量生成条码231
第11章坐在旁边喝点茶——RPA(机器人流程自动化)234
11.1自动化WindowsGUI库——pywinauto库234
11.1.1如何使用pywinauto库235
11.1.2在记事本中自动输入信息240
11.2客服机器人242
第12章给你的程序穿上“马甲”——使用GUI库247
12.1为什么选择Tkinter247
12.1.1编写第一个Tkinter程序248
12.1.2为按钮添加事件处理功能249
12.2布局管理250
12.2.1pack布局的更多属性251
12.2.2grid布局252
12.3工作中常用的控件253
12.3.1使用messagebox253
12.3.2进度条256
12.3.3文件选择器259
第13章将Python程序打包成.exe文件263
13.1安装auto-py-to-exe工具264
13.2使用auto-py-to-exe工具265
13.3打包成单个文件还是目录268
13.4包含资源文件怎么办268
参考文献
- ↑ 100部科普经典名著,豆瓣,2018-04-26
- ↑ 关于我们,电子工业出版社