求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

趣玩Python·自動化辦公真簡單檢視原始碼討論檢視歷史

事實揭露 揭密真相
前往: 導覽搜尋

趣玩Python·自動化辦公真簡單》,關東升 著,出版社: 電子工業出版社。

電子工業出版社成立於1982年10月,是工業和信息化部直屬的科技與教育出版社,每年出版新書2400餘種,音像和電子出版物400餘種,期刊8種,出版物內容涵蓋了信息科技的各個專業分支以及工業技術、經濟管理、大眾生活、少兒科普[1]等領域,綜合出版能力位居全國出版行業前列[2]

內容簡介

本書以數據收集→數據清洗→數據分析→數據可視化→根據數據可視化結果(即圖表)做決策為脈絡,介紹Python在實際工作場景中的應用,側重於用Python解決工作中的數據處理問題,並通過實戰形式講解如何用Python實現數據收集、數據清洗、數據分析及可視化等工作。本書還詳細講解了Python自動化辦公方面的內容,包括:Excel自動化、Word自動化、PPT自動化、PDF文件處理、圖形圖像處理和RPA(機器人流程自動化),並介紹了GUI技術和應用程序打包相關知識。本書秉承有趣、有料、好玩、好用的理念,特意設計了兩個人物角色,通過這兩個人物角色的輕鬆對話、搞笑形象及誇張動作,把複雜的技術問題講解得深入淺出,非常適合廣大讀者閱讀。

目錄

第1章千里之行,始於足下——Python基礎1

1.1Python解釋器2

1.2PyCharm開發工具3

1.2.1下載和安裝4

1.2.2設置PyCharm工具5

1.3第一個Python程序7

1.3.1創建項目7

1.3.2創建Python代碼文件9

1.3.3編寫代碼10

1.3.4運行程序11

1.4文本編輯工具+Python解釋器實現11

1.4.1編寫代碼11

1.4.2運行程序12

1.4.3代碼解釋13

1.5Python中的基礎語法14

1.5.1標識符14

1.5.2關鍵字15

1.5.3變量聲明15

1.5.4語句15

1.5.5代碼塊16

1.5.6模塊16

1.6數據類型與運算符17

1.6.1數據類型17

1.6.2運算符19

1.7控制語句22

1.7.1分支語句22

1.7.2循環語句24

1.7.3跳轉語句27

1.8序列28

1.8.1索引操作28

1.8.2序列切片29

1.8.3可變序列——列表30

1.8.4不可變序列——元組31

1.8.5列表推導式32

1.9集合33

1.9.1創建集合33

1.9.2集合推導式34

1.10字典34

1.10.1創建字典35

1.10.2字典推導式36

1.11字符串36

1.11.1字符串的表示方式36

1.11.2將字符串格式化38

1.11.3正則表達式39

1.12函數40

1.12.1匿名函數與lambda表達式41

1.12.2數據處理中的兩個常用函數42

1.13文件操作與目錄管理44

1.13.1文件操作44

1.13.2文本文件讀寫46

1.13.3二進制文件讀寫47

1.13.4os模塊48

1.13.5os.path模塊49

1.14異常處理機制51

1.14.1捕獲異常51

1.14.2釋放資源52

第2章讓「蟲子」幫你收集數據——網絡爬蟲技術56

2.1數據從哪裡來——收集數據56

2.2收集股票的歷史交易數據58

2.3自動爬取數據60

2.4從繁雜的HTML代碼中解析數據——使用BeautifulSoup庫62

2.5爬不到數據怎麼辦——使用Selenium工具68

2.5.1Ajax動態數據70

2.5.2使用Selenium爬取數據70

2.6有驗證碼怎麼辦74

2.6.1驗證碼概述74

2.6.2驗證碼識別74

2.6.3安裝OCR引擎Tesseract75

2.6.4安裝pytesseract76

2.6.5安裝Pillow庫77

2.6.6安裝OpenCV78

2.6.7驗證碼識別前的圖像預處理78

2.6.8驗證碼識別過程79

2.7實戰訓練:電網考試平台的驗證碼識別81

2.7.1配置自己的Web服務器81

2.7.2啟動Web服務器82

2.7.3使用Selenium模擬登錄過程82

2.8提高「蟲子」的工作效率86

第3章洗一洗「髒數據」——數據清洗89

3.1數據清洗那些事兒89

3.2訪問Excel文件庫——xlwings庫90

3.2.1xlwings庫中對象的層次關係91

3.2.2打開Excel文件並讀取其單元格數據91

3.2.3如何獲取表格區域93

3.2.4獲取表格行數和列數96

3.2.5轉置表格97

3.2.6單元格默認的數據類型98

3.2.7寫入單元格數據99

3.2.8設置單元格樣式102

3.2.9這樣遍歷單元格太麻煩了104

3.2.10刪除列105

3.2.11刪除行106

3.2.12調用VBA宏批量刪除重複的數據107

3.2.13找出格式不統一的數據110

3.3填充缺失的值111

3.3.1固定值填充112

3.3.2平均值填充113

第4章把「寶貝」收好了——數據存儲115

4.1讀取CSV文件116

4.2將爬取的數據保存為CSV文件117

4.3SQLite數據庫118

4.4使用GUI管理工具管理SQLite數據庫119

4.5sqlite3模塊API121

4.6將爬取的數據保存到SQLite數據庫122

4.7在數據庫中查詢數據124

第5章找出隱藏在數據中的「黃金屋」——數據分析126

5.1數據分析那些事兒126

5.2使用Excel進行數據分析127

5.2.1老闆讓我找出北京周邊的房價信息127

5.2.2找出北京周邊房屋面積大於120m2的小區129

5.2.3找出東城區和西城區房屋面積大於120m2的小區130

5.2.4找出有北京優選房價的小區131

5.3讓「熊貓」幫我們分析數據——使用pandas庫132

5.3.1Series數據結構132

5.3.2DataFrame數據結構134

5.4使用pandas庫讀取Excel文件136

5.4.1舉個「栗子」:從Excel文件中讀取全國總人口數據137

5.4.2跳過頭部行和尾部行138

5.4.3當「熊貓」遇到CSV文件139

5.4.4當「熊貓」遇到SQLite141

5.4.5使用pandas庫寫入數據到CSV文件143

5.4.6使用pandas庫寫入數據到Excel文件144

5.4.7使用pandas庫找出各城區有優選房價的小區145

5.4.8按照各城區的平均房價排序146

5.5數據分析與數據透視表的故事148

第6章一圖抵萬言——數據可視化151

6.1數據可視化那些事兒151

6.2使用Matplotlib庫繪製圖表152

6.2.1安裝Matplotlib庫152

6.2.2圖表的基本構成要素152

6.2.3繪製城區優選房價柱狀圖153

6.2.4北京房價區間占比餅狀圖155

6.2.5北京各城區房價分布散點圖157

6.2.6貴州茅台股票的歷史成交量折線圖158

6.2.7繪製股票的歷史OHLC圖159

6.3調用Excel繪製圖表161

6.3.1繪製三維折線圖161

6.3.2繪製三維簇狀條形圖163

第7章辦公離不開的「字」處理——操作Word文件165

7.1訪問Word文件庫——python-docx庫165

7.1.1python-docx庫中的那些對象166

7.1.2打開Word文件並讀取內容167

7.1.3寫入數據到Word文件169

7.1.4在Word文件中添加表格171

7.1.5設置文件樣式173

7.1.6修改文件樣式175

7.2解決在工作中使用Word時遇到的問題176

7.2.1批量轉換.doc文件為.docx文件176

7.2.2採用模板批量生成證書文件178

7.2.3批量統計文件頁數和字數181

7.2.4批量轉換Word文件為PDF文件183

第8章演示利器PPT——操作PPT文檔186

8.1訪問PowerPoint文檔庫——python-pptx庫186

8.1.1PPT中的基本概念187

8.1.2python-pptx庫中的那些對象188

8.1.3創建PPT文檔189

8.1.4添加更多的幻燈片190

8.1.5在PPT幻燈片中添加表格192

8.1.6在PPT幻燈片中添加圖表195

8.2解決在工作中使用PPT時遇到的實際問題197

8.2.1批量轉換.ppt文檔為.pptx文檔197

8.2.2批量轉換PPT文檔為PDF文件199

第9章操作跨平台的文件格式——PDF文件201

9.1PDF文件的優勢201

9.2操作PDF文件庫——PyPDF2庫202

9.2.1PyPDF2庫中的對象202

9.2.2讀取PDF文件的內容202

9.2.3拆分PDF文件204

9.2.4用更多的方法拆分PDF文件205

9.2.5合併PDF文件207

9.2.6對PDF文件批量添加水印208

9.2.7批量加密PDF文件211

9.2.8批量解密PDF文件213

9.2.9暴力破解PDF文件的密碼214

9.3解析PDF文件庫——pdfplumber庫216

9.3.1提取PDF文件中的文本信息216

9.3.2提取PDF文件中的表格信息217

第10章有圖有真相——批量處理圖像文件218

10.1圖像處理庫——Pillow庫218

10.1.1讀取圖像文件的信息219

10.1.2我想要png文件——批量轉換圖像格式221

10.1.3批量設置圖像的大小222

10.2旋轉圖像225

10.3添加水印226

10.4生成各種各樣的「碼」228

10.4.1批量生成二維碼228

10.4.2批量生成條碼231

第11章坐在旁邊喝點茶——RPA(機器人流程自動化)234

11.1自動化WindowsGUI庫——pywinauto庫234

11.1.1如何使用pywinauto庫235

11.1.2在記事本中自動輸入信息240

11.2客服機器人242

第12章給你的程序穿上「馬甲」——使用GUI庫247

12.1為什麼選擇Tkinter247

12.1.1編寫第一個Tkinter程序248

12.1.2為按鈕添加事件處理功能249

12.2布局管理250

12.2.1pack布局的更多屬性251

12.2.2grid布局252

12.3工作中常用的控件253

12.3.1使用messagebox253

12.3.2進度條256

12.3.3文件選擇器259

第13章將Python程序打包成.exe文件263

13.1安裝auto-py-to-exe工具264

13.2使用auto-py-to-exe工具265

13.3打包成單個文件還是目錄268

13.4包含資源文件怎麼辦268

參考文獻

  1. 100部科普經典名著,豆瓣,2018-04-26
  2. 關於我們,電子工業出版社