lora技術應用課程

AI資料擷取暨應用

(資料爬蟲)

本課程將帶領學員認識常見的資料來源,並利用 Python 程式語言實作資料爬蟲抓取與進行初步的資料處理與機器學習。
課程中將涵蓋到常見的爬蟲框架「Request + Beatifulsoup」與互動式的「Selenium」工具,並且運用scikit-learn進行機器學習,課程搭配大量實作演練,逐步培養撰寫自動化資料收集與機器學習之程式設計能力。

學習目標

讓學員能夠將Python程式應用在資料爬蟲與收集上,初步學習資料的應用與操作,並建構機器學習模型,達到預測之應用。

選擇中華數位的好處

教學實力

20年教育訓練經驗 + 業界產品開發講師不定期編譯符合業界需求的課程內容,用專業的角度和實戰經驗帶你快速與產業界接軌。

業界肯定的專業實力見證

百大企業派訓與團體外訓

客製化的內外訓教學服務,依專案需求調整課程內容。

企業客製化嵌入式教育訓練 企業客製化嵌入式教育訓練

結訓就業沒煩惱

實作專題立即與產業接軌就業沒煩惱

嵌入式課程結訓就業

課程大綱

  • 機器學習導論
    1. 監督式學習方法
      (線性回歸, SVM, Decision Tree…)
    2. 非監督式學習方法
      (K-menas,K-means++…)
  • Scikit-Learn
    機器學習相關應用
    1. 介紹Scikit-learn套件
    2. 利用Scikit-learng套件建立監督式 以及非監督是方法之分類器
    3. 介紹資料標準化(Standardization), 資料清理(Data Cleaning), 補值等等資料前處理概念
  • 爬蟲的環境與準備
    1. Python 程式語言入門
    2. 環境安裝與套件介紹
  • 常見的資料來源與儲存格式
    1. 常見的資料釋出方式
    2. 檔案下載與 API 串接實作
    3. 資料儲存格式
  • HTTP 網站溝通協定
    1. HTTP 網頁前後端溝通
    2. 拆解與解析 HTML 網頁內容
  • 資料爬蟲的原理與實作
    1. 靜態頁面的資料爬蟲概念
    2. 利用 Request 與 Beatifulsoup
  • 實作靜態網頁爬蟲
    1. 互動式的網頁資料爬蟲
    2. 利用 Selenium 實作互動式網頁資料爬蟲
  • 資料爬蟲
    1. 真實世界的爬蟲應用
    2. 資料清理與儲存
    3. 淺談反爬蟲與破解機制
  • 課程實作演練
    1. 實作檔案下載與 API 程式串接
    2. 利用 Request 與 Beatifulsoup 實作靜態網頁爬蟲
    3. 利用 Selenium 實作互動式網頁資料爬蟲
    4. 利用 scikit-learn 實作機器學習

適合對象

  • 具備基礎Python程式撰寫能力,有資料使用需求且希望自動化收集者
  • 想導入數據分析到產業的在職人士

職涯發展

  • 資料分析工程師
  • 大數據分析及數據挖掘
  • 數據研發工程師
  • AI演算法工程師

開課時間

109年3月7日至109年3月28日

( 周六全天班 AM9:30至PM5:30 )

專業課程諮詢服務

說明會時間約50分鐘,歡迎攜伴參加

姓名

電話

E-Mail