Python3·x網絡爬蟲從零基礎到項目實戰檢視原始碼討論檢視歷史
《Python3·x網絡爬蟲從零基礎到項目實戰》,史衛亞 著,出版社: 北京大學出版社。
北京大學出版社年出版新書約1000種,重印書2700餘種次,出版物已覆蓋人文科學、社會科學、自然科學[1]和工程技術各領域。現有產品中,大中專教材占35%,學術圖書占45%,一般圖書占20%。在文史哲、法學、經濟管理、學術普及、漢語教學等出版領域具有比較明顯的優勢和特色[2]。
內容簡介
《Python 3.x網絡爬蟲從零基礎到項目實戰》介紹了如何使用Python來編寫網絡爬蟲程序,內容包括網絡爬蟲簡介、發送請求、提取數據、使用多個線程和進程進行並發抓取、抓取動態頁面中的內容、與表單進行交互、處理頁面中的驗證碼問題及使用Scrapy和分布式進行數據抓取,並在最後介紹了使用本書講解的數據抓取技術對幾個真實的網站進行抓取的實例,旨在幫助讀者活學活用書中介紹的技術。
本書提供了與圖書內容全程同步的教學錄像。此外,還贈送了大量相關學習資料,以便讀者擴展學習。
本書適合任何想學習Python爬蟲的讀者,無論您是否從事計算機相關專業,是否接觸過Python,均可以通過學習本書快速掌握Python爬蟲的開發方法和技巧。
作者介紹
史衛亞,博士,副教授,IEEE會員,CCF會員,INNS會員。2009年獲得復旦大學計算機應用專業博士學位。2015—2016年在美國北卡羅來納大學做訪問學者,對機器學習、大數據檢索、數據庫、圖像和視頻處理、人工智能和模式識別等有深入研究。
參考文獻
- ↑ 第十講科學學派_圖文,豆丁網,2016-10-18
- ↑ 規模現狀,北京大學出版社