AI資料擷取及應用(資料爬蟲) 中華行動數位嵌入式教育訓練專家

課程諮詢
開課時間
課程大綱

AI資料擷取暨應用

(資料爬蟲)

本課程將帶領學員認識常見的資料來源，並利用 Python 程式語言實作資料爬蟲抓取與進行初步的資料處理與機器學習。
課程中將涵蓋到常見的爬蟲框架「Request + Beatifulsoup」與互動式的「Selenium」工具，並且運用scikit-learn進行機器學習，課程搭配大量實作演練，逐步培養撰寫自動化資料收集與機器學習之程式設計能力。

學習目標

讓學員能夠將Python程式應用在資料爬蟲與收集上，初步學習資料的應用與操作，並建構機器學習模型，達到預測之應用。

選擇中華數位的好處

教學實力

20年教育訓練經驗 + 業界產品開發講師不定期編譯符合業界需求的課程內容，用專業的角度和實戰經驗帶你快速與產業界接軌。

業界肯定的專業實力見證

百大企業派訓與團體外訓

客製化的內外訓教學服務，依專案需求調整課程內容。

結訓就業沒煩惱

實作專題立即與產業接軌就業沒煩惱

課程大綱

機器學習導論

監督式學習方法
(線性回歸, SVM, Decision Tree…)
非監督式學習方法
(K-menas,K-means++…)

Scikit-Learn
機器學習相關應用

介紹Scikit-learn套件
利用Scikit-learng套件建立監督式以及非監督是方法之分類器
介紹資料標準化(Standardization), 資料清理(Data Cleaning), 補值等等資料前處理概念

爬蟲的環境與準備

Python 程式語言入門
環境安裝與套件介紹

常見的資料來源與儲存格式

常見的資料釋出方式
檔案下載與 API 串接實作
資料儲存格式

HTTP 網站溝通協定

HTTP 網頁前後端溝通
拆解與解析 HTML 網頁內容

資料爬蟲的原理與實作

靜態頁面的資料爬蟲概念
利用 Request 與 Beatifulsoup

實作靜態網頁爬蟲

互動式的網頁資料爬蟲
利用 Selenium 實作互動式網頁資料爬蟲

資料爬蟲

真實世界的爬蟲應用
資料清理與儲存
淺談反爬蟲與破解機制

課程實作演練

實作檔案下載與 API 程式串接
利用 Request 與 Beatifulsoup 實作靜態網頁爬蟲
利用 Selenium 實作互動式網頁資料爬蟲
利用 scikit-learn 實作機器學習

適合對象

具備基礎Python程式撰寫能力，有資料使用需求且希望自動化收集者
想導入數據分析到產業的在職人士

職涯發展

資料分析工程師
大數據分析及數據挖掘
數據研發工程師
AI演算法工程師

開課時間

109年3月7日至109年3月28日

( 周六全天班 AM9:30至PM5:30 )

專業課程諮詢服務

說明會時間約50分鐘，歡迎攜伴參加