本課程涵蓋文字資料分析與探勘的主要技術,採用R或Python語言做為文字探勘工具,著重於自然語言處理的統計基礎。以實作方式進行自然語言處理流程貫穿中英文文字案例的講解,期能讓學員挖掘出潛藏於組織內外部文字資料中的價值。 資策會「文字資料探勘實作班」將於2016年10月29日開辦,相關資訊請參閱課程網頁,或電(02)6631-6533,黃小姐。
課程大綱: 1. 文字資料探勘 partⅠ ‧ 文字資料探勘簡介與應用案例 ‧ 文件記號化 ‧ 詞袋模型與詞頻計算(文件詞項矩陣) ‧ 字詞關聯與文字雲 ‧ 屬性挑選與維度縮減 2. 文字資料探勘 partⅡ ‧ 詞項與文件群集 ‧ 文件分類 ‧ 詞性標注 ‧ n元(n-gram)模型 ‧ 主題模型 ‧ 分散式文字資料處理 詳細內容請參考課程網址:http://www.iiiedu.org.tw/ites/TEXT.htm
- 新聞稿有效日期,至2016/10/28為止
聯絡人 :黃小姐 聯絡電話:(02)6631-6533 電子郵件:julie620@iii.org.tw
上一篇:資策會「Big Data資料分析三部曲-R軟體與資料視覺化」(台北)
下一篇:海尼根敬理性飲酒的英雄 以理性飲酒為榮
|
■ 訂閱制付費會員經營之道:我積攢一生的工作經驗 - 2020/12/06 ■ 共享經濟:以人民的名義爭奪流量入口 - 2017/06/18 ■ 影音網站的未來(三) PGC孵化IP,直播更接近長尾 - 2016/10/16 ■ 影音網站的未來(二)短影音適合往社交和工具發展 - 2016/10/09 ■ 影音網站的未來(一)長尾效應與頭部效應無法兼顧 - 2016/10/02 ■ 大部分O2O 模式違反網際網路經濟特性 - 2015/02/08 ■ 融資是怎麼回事(下)什麼人能拿到投資 - 2015/01/04 ■ 融資是怎麼回事(中)讀懂投資人的唇語 - 2014/12/21 ■ 融資是怎麼回事(上)融資是迭代的過程 - 2014/12/14
|