了解更多課程訊息
姓      名
連絡電話
電子信箱
新舊學員
舊學員 新學員
選擇課程
選擇場次
驗證碼
了解更多課程訊息

AI資料擷取及應用(資料爬蟲)

本課程將帶領學員認識常見的資料來源,並利用 Python 程式語言實作資料爬蟲抓取與進行初步的資料處理與機器學習。
課程中將涵蓋到常見的爬蟲框架「Request + Beatifulsoup」與互動式的「Selenium」工具,並且運用scikit-learn進行機器學習,課程搭配大量實作演練,逐步培養撰寫自動化資料收集與機器學習之程式設計能力。

上課時數:28小時
課程目標: 讓學員能夠將Python程式應用在資料爬蟲與收集上,初步學習資料的應用與操作,並建構機器學習模型,達到預測之應用。
課程大綱
機器學習導論
  • 監督式學習方法
    (線性回歸, SVM, Decision Tree…)
  • 非監督式學習方法
    (K-menas,K-means++…)
Scikit-Learn機器學習相關應用
  • 介紹Scikit-learn套件
  • 介紹資料標準化(Standardization),
    資料清理(Data Cleaning),
    補值等等資料前處理概念
  • 利用Scikit-learng套件建立監督式
    以及非監督是方法之分類器
  • opacity: 0;
  • opacity: 0;
爬蟲的環境與準備
  • Python 程式語言入門
  • 環境安裝與套件介紹
常見的資料來源與儲存格式
  • 常見的資料釋出方式
  • 資料儲存格式
  • 檔案下載與 API 串接實作
  • 視覺化工具: TensorBoard
HTTP 網站溝通協定
  • HTTP 網頁前後端溝通
  • 拆解與解析 HTML 網頁內容
資料爬蟲的原理與實作
  • 靜態頁面的資料爬蟲概念
  • 利用 Request 與 Beatifulsoup
實作靜態網頁爬蟲
  • 互動式的網頁資料爬蟲
  • 利用 Selenium 實作互動式網頁資料爬蟲
資料爬蟲
  • 真實世界的爬蟲應用
  • 資料清理與儲存
  • 淺談反爬蟲與破解機制
  • OOXX
課程應用實例
  • 實作檔案下載與 API 程式串接
  • 利用 Selenium 實作互動式網頁資料爬蟲
  • 利用 scikit-learn 實作機器學習
  • 利用 Request 與 Beatifulsoup
    實作靜態網頁爬蟲
適合對象
  • 具備基礎Python程式撰寫能力,有資料使用需求且希望自動化收集者       
  • 想導入數據分析到產業的在職人士       
職涯發展
  • 資料分析工程師
  • 數據研發工程師
  • 大數據分析及數據挖掘
  • AI演算法工程師
 
 
下載報名表
開課時間
•108年9月21日至108年10月26日 
(週六全天班 AM9:30至PM5:30)
相關課程: AI Chabot對話機器人
相關課程: Spark大數據分析實作
................................................................................
報名方式
•電話報名:專線02-2311-7355
線上報名 下載報名表
Mail:grace@cadtc.com.tw
傳真:02-2331-3591
現場報名:
親洽中華行動數位教育訓練中心 - 台北中心
(台北市開封街1段2號9樓)
................................................................................
上課地點
台北市開封街一段2號9樓 > 地圖 <
(台北火車站│館前路口│麥當勞隔壁大樓)
................................................................................
test
 
獨家 Cortex-A9系列開發板
搭配開發板周邊模組教學
24-7雲端實驗室
全天後可上線操作練習
學員結訓專題作品發表
課程規劃的專題製作
學員結業後服務更貼心
提供Blog及講師技術分享
隨時提供學員工作職缺
供求職資訊,訓用合一
講師親自撰寫上課講義
定時更新課程講義,掌握最新技術動脈
嵌入式系統書籍
定期訂閱熱門書籍,供學員免費借閱
免費供應飲料
研磨咖啡、特調冷飲、現泡熱茶
環型教室、數位設備
師生互動式廣播教學系統

 
最新推薦課程