AI資料擷取暨應用
(資料爬蟲)
課程中將涵蓋到常見的爬蟲框架「Request + Beatifulsoup」與互動式的「Selenium」工具,並且運用scikit-learn進行機器學習,課程搭配大量實作演練,逐步培養撰寫自動化資料收集與機器學習之程式設計能力。
學習目標
讓學員能夠將Python程式應用在資料爬蟲與收集上,初步學習資料的應用與操作,並建構機器學習模型,達到預測之應用。
選擇中華數位的好處
教學實力
20年教育訓練經驗 + 業界產品開發講師不定期編譯符合業界需求的課程內容,用專業的角度和實戰經驗帶你快速與產業界接軌。
業界肯定的專業實力見證
百大企業派訓與團體外訓
客製化的內外訓教學服務,依專案需求調整課程內容。
結訓就業沒煩惱
實作專題立即與產業接軌就業沒煩惱
課程大綱
- 機器學習導論
-
監督式學習方法
(線性回歸, SVM, Decision Tree…) -
非監督式學習方法
(K-menas,K-means++…) -
Scikit-Learn
機器學習相關應用 - 介紹Scikit-learn套件
- 利用Scikit-learng套件建立監督式 以及非監督是方法之分類器
- 介紹資料標準化(Standardization), 資料清理(Data Cleaning), 補值等等資料前處理概念
- 爬蟲的環境與準備
- Python 程式語言入門
- 環境安裝與套件介紹
- 常見的資料來源與儲存格式
- 常見的資料釋出方式
- 檔案下載與 API 串接實作
- 資料儲存格式
- HTTP 網站溝通協定
- HTTP 網頁前後端溝通
- 拆解與解析 HTML 網頁內容
- 資料爬蟲的原理與實作
- 靜態頁面的資料爬蟲概念
- 利用 Request 與 Beatifulsoup
- 實作靜態網頁爬蟲
- 互動式的網頁資料爬蟲
- 利用 Selenium 實作互動式網頁資料爬蟲
- 資料爬蟲
- 真實世界的爬蟲應用
- 資料清理與儲存
- 淺談反爬蟲與破解機制
- 課程實作演練
- 實作檔案下載與 API 程式串接
- 利用 Request 與 Beatifulsoup 實作靜態網頁爬蟲
- 利用 Selenium 實作互動式網頁資料爬蟲
- 利用 scikit-learn 實作機器學習
適合對象
- 具備基礎Python程式撰寫能力,有資料使用需求且希望自動化收集者
- 想導入數據分析到產業的在職人士
職涯發展
- 資料分析工程師
- 大數據分析及數據挖掘
- 數據研發工程師
- AI演算法工程師
開課時間
109年3月7日至109年3月28日
( 周六全天班 AM9:30至PM5:30 )
專業課程諮詢服務
說明會時間約50分鐘,歡迎攜伴參加

首頁
ARM智慧物聯網人才養成 -
AI資料擷取及應用(資料爬蟲)