Python x Crawler ( 網路爬蟲 )
時下最夯的程式語言 - Python,不只是一個普通的程式語言,可以製作成資料抓取的『網路爬蟲』透過這隻爬蟲,去網路上蒐集所需的資料,並進一步製作資料存取的數據分析,本課程將教您如何使用Python寫出您在大數據時代第一支網路爬蟲
難易度: 初階
課程總時數: 18 小時
課堂數: 6
開課日期: 2018-08-11
星期幾:
六
NTD 27,000
send 授課對象
- 對Python有興趣者
- 對於在工作領域上想利用程式開發來自動化工作者
- 想開發應用程式或者網路後台者
- 想利用python在網路上爬下有價值資料者
send 您將會學到什麼
- 網路概論
- URL
- 網路資源
- GET, POST
- 使用Request模組取資源
- 使用BeautifulSoup幫助分析
- 網頁進階介紹
- JavaScript簡介
- JavaScript基本語法
- Python進階爬蟲
- 爬有JavaScript的網站
send 課程說明
聽聽別人怎麼說
什麼是網路爬蟲
爬蟲是一個可以自動化抓取網頁內容的程式。
相信大家多少都遇過需要抓取網頁資訊的時候,也許是因為要做報告、或是出於興趣想研究,需要相關參考資料。最簡單的方法就是一筆一筆複製,然後貼到excel或是文編輯器儲存,再做後續的分析。
如果只有幾十筆還好,那假如有上百筆、上千筆怎麼辦?
重複的動作做個幾次,大致上就可以拆解出每個步驟:先進入到某個頁面、複製所需要的欄位資訊、貼入文字編輯器,接著不斷循環,直到所有頁面都被翻完,就大功告成啦。
是的,用講的都很輕鬆,一句話就結束了。
但如果實際下來做,在反覆機器式的複製貼上過程,到了某個境界後,只剩下眼球跟雙手飛快的動著,例行性的動作已經被肌肉記憶了,腦袋在喘息的空檔開始思考人生的意義(以及倒數還剩幾筆),相信每個經歷過的修行者都曾經想過:要是可以自動化該有多好?
沒錯~爬蟲就是使喚機器去做我們懶得去做的事情!歡迎來到這美好的世界。
課程目標
- 了解爬蟲的能力
- 了解爬蟲在法律上與道德的規範
- 實際嘗試一個簡單爬蟲
- 實際嘗試爬過擁有JavaScript的網站
send 解決的問題
- Python一點不都不難
- 程式語言遇到的通病,一一解除
- 教你寫出一隻爬蟲