精選幾個機器學習的資源

學習貴精不貴多,推薦幾個機器學習資源&公眾號文章

身處資料爆炸的年代,要學任何事物已經沒有學不到的問題,只有怎麼學才最有效最適合自己的問題。資料分析的話,網上也可以查到不少吸引眼球的內容,例如“3週學會數據分析”,或是“史上最全的數據分析學習資源”。

當然,我很感謝這些文章提供的內容,減少了搜尋成本,但不免也有遇到濫竽充數的情況。我認為能夠吸收內化才是自己的,貴精不貴多。因此這邊只推薦幾個自己學習過程中,真的覺很不錯的資源。

在職場上,提升自己競爭力的方法不外乎更熟練的應用以及更廣泛的知識及看法。針對這兩個目的,推薦的第一個部分是機器學習,第二個是常看的微信公眾號文章。


一、機器學習

機器學習應該是目前資料分析的內容中,最被人所熟悉的。在商業的場景中,個性化推薦、導購、用戶流失/續約模型等都是算法的應用。(如果不清楚數據分析的內容分工,可以看談談數據分析的眾多title)

吳恩達的史丹佛_CS229

網易公開課的資源,有中英文字幕,一共20集,每一集約1小時。學習這門課你需要有稍微強的線性代數及統計學的基礎。

吳恩達不愧是機器學習的大師,課程相當啟發思考,例如在過程中你可能會想到”模型對訓練集的擬合是越高越好嗎?”或是“分類問題只能切一刀分兩類嗎?”的延伸問題

內容也很有架構,以前幾堂課來說,先介绍兩個基本回歸,其中線性迴歸有若干解法。再介绍這兩個回歸的一般化,即GLM的特例。更進一步,說明生成學習算法跟GML各有千秋,然後介绍Naive Bayes。開始講非線性分類器,課程相當环环相扣。

另外推薦兩個前人的github,在這裡可以下載到課件的講義以及整理過的筆記:

吳恩達在coursera也有開課(Machine Learning | Coursera),這門課可以說是許多人在機器學習的啟蒙課程,難度低於CS-229。總共有8萬人給出了評分,平均得分4.9分(滿分5分)。

大部分Coursera上的課程評分處於4–4.5分之間,能做到4.9分的課程寥寥無幾…

Google MLCC

Google企業內部員工訓練課程。 MLCC 課程約 15 小時,包括互動課程、研究人員講座以及 40 多個操作練習,當然也會在裡面推廣TensorFlow。

除了中英文字幕外,還有中文發音,但很恐怖還是聽英文的就好。此課程目的是讓一般人都可以學習ML,相對吳恩達的課程,內容親切、操作性高。

在公司推廣機器學習概念時,我也是用吳恩達的架構

二、微信公眾號

微信公眾號有點像臉書的粉絲頁,但又有點像封閉的medium,相較facebook查看過往文章的體驗更好。

關注的公眾號有新的文章發布的話,會自動推送,我通常會快速瀏覽一下,如果內容有幫助的話先加到收藏,到週末把這一週收藏的內容好好看一遍,再分類整理到記事本。

透過這些公眾號的優質的內容,可以學到代碼、可以掌握市場變化,可以了解他人的經驗。

  • 饅頭商學院:有許多產品、營運、行銷類型的內容及案例
  • 一個程序員的日常:個人作者,用數據講故事,分享程序員的感悟,我自己定位成輕鬆小品。內容都滿有趣的
  • R語言中文社區:中國最大的R語言學習平台
  • 人工智能愛好者社區:機器學習的理論、案例及代碼都有,也包含python、R、kaggle等
  • CSDN:全球最大中文IT社区,有相關的時事內容,也有職場相關及技術相關
  • 36氪:中國領先的科技媒體,報導最新的互聯網科技及新聞

最後

  1. 數據分析是一個不斷發展的領域,已經在應用的公司想探索更新的技術,尚未應用的公司想要導入到企業。裡面有太多太多的學問,不論軟知識或硬實力。這個探索的過程有時想想還挺累的,但也是因此有趣的地方。
  2. 每本書都不可能面面俱到,即便我認為上述的資源可以cover大部分,還是要持續學習,藉由扎實的基礎慢慢把知識做更深入、一點一滴的補充。
  1. 最近感覺自律的程度可是說是影響進步多寡的最高參數。除了少數天才外,大多數人的資質都是差不多太多,看到許多人這麼厲害,其背後所付出的努力、以及非常自律的照自己的進度去學習,持續的進步,才是能力的分界線。

數據分析系列一:談談數據分析的眾多Title 

數據分析系列二:數據分析的一週工作日程 

數據分析系列三:身為資料分析師,你該如何展現工作中的價值? 

數據分析系列四:如何量化職場規劃?我這次的轉職規劃與Offer選擇 

數據分析系列五:為什麼要關心資料來源?談談埋點數據的陷阱

在〈精選幾個機器學習的資源〉中有 1 則留言

  1. 自動引用通知: 身為數據分析師,我怎麼看hahow上”R語言和商業分析”這門課 – 國欣說. Rock Data

歡迎分享你的心得

🙌 你是數據分析新手嗎?入行必學SQL課程由此開始 >>>

X
Scroll to Top