隨著科技的發展,每天每時每刻都有大量數據被產生和存儲下來。如何才能把這些數據變成有用的信息價值被人類所利用,就會通過一系列的收集、統計、整理、分析、挖掘等方法和技術來實現整個過程。數據科學是一門交叉的學科,涉及到很多的領域包括統計學、數學、計算機、人工智能、機器學習、數據庫、模式識別、可視化技術等多學科的知識。大數據時代的到來,為各個科學領域帶來了新的改革。
全球最頂尖管理咨詢公司麥肯錫(McKinsey)出具了一份詳細的分析報告,大數據或者數據工作者的崗位需求將激增,其中大數據科學家的缺口在140000到190000之間,對于懂得如何利用大數據做決策的分析師和經理的崗位缺口則將達到1500000!
其中對大數據處理需求最旺盛的行業包括:制藥業、計算機軟件、互聯網、科研、IT技術服務、生物技術。事實上,大數據工作者可以施展拳腳的領域非常廣泛,從國防部、互聯網創業公司到金融機構,到處需要大數據項目來做創新驅動。數據分析或數據處理的崗位報酬也非常豐厚,在硅谷,入門級的數據科學家的收入已經是6位數了(美元)。
數據科學的三類職業方向機器學習、數據分析和數據科學家
(1)機器學習工程師 Machine Learning Engineer
代表了技術含量較高的方向,工作內容主要是開發機器學習系統和用這些系統解決實際問題。一般需要ship production code,做出來的是數據產品。
(2)數據分析員 Data Analyst
工作內容俗稱analytics (product analytics or business analytics),從數據中提取insight,估計投資回報比,為產品方向提建議,所用工具一般較基礎,比如寫SQL query取數據、用R/Python做簡單的分析、用Tableau/Excel作圖比較常見,能自己開發Dashboard算是analyst里面技術強的;工作需要產生各種形式的報告;在統計層次上,懂基本t-test和線性回歸即可。
(3)數據科學家 Data Scientist
很多人說,我想做數據科學家,我想做機器學習,而這類職位就是大家想象中的那種。此類職位工作內容以高級建模為主,會針對復雜的問題來設計技術方案,比如Uber叫車的ETA、各種定價系統、Airbnb和金融行業的Fraud Detection、Amazon物流管理,FB/Linkedin的社交網絡或者ebay/Airbnb/Uber這樣供需雙方Marketplace市場規模的實驗。這些例子,聽上去就不是寫SQL能解決的,也不是會寫代碼就能做出來的,都需要比較深的領域知識。
申請MS Data Science 需要什么樣的背景?
不論是陸本還是美本,在本科階段就開設Data Science這個專業的學校并不多,所以大家不要一看自己專業名字和數據科學不搭邊就覺得是轉專業申請。
首先,本科是計算機科學CS的同學,是最符合申請條件的,因為大多數數據工作都是通過編程和數據庫的相關手段進行的,同時學過統計、微積分、高級語言;
例如哈佛大學對于MSDS的本科背景要求是:希望有微積分、線性代數,熟悉概率和統計干涉、能使用至少1種編程語言,例如Python或R,了解計算機科學概念。
Prerequisites we expect from applicants include knowledge of calculus and linear algebra, familiarity with probability and statistical inference, fluency in at least one programming language such as python or R, and an understanding of basic computer science concepts.
其次,本科背景是統計、數學或應用數學,且有一定編程基礎的同學也可以申請,這都是很好的專業匹配。
最后,商科背景出身,但量化背景較強的商科專業,比如金工,但又希望能選擇一個STEM專業的同學,那DS顯然也是個非常好的選擇。
所以說,如果你有比較強的編程背景,又有比較好的數理基礎,那你就很有競爭力;而純商科背景的同學,如果沒有強的量化背景,或者不懂編程,那建議還是數據科學DS和商業分析BA混合申請,因為商業分析更加偏商科,開在商學院,對商科背景接納程度大很多。
如何加強背景?
建議可以從科研方面加強,在大學期間最好找和量化相關的科研,如果實在沒有,可以把相關的課程大作業拿來用。再退而求其次,也可以是計算機軟件、數據庫相關。如果沒有科研經歷,那將是極大地硬傷。
此外,可以參加一些學術活動。學術活動的平臺有很多,比如最近很火的Kaggle,再如阿里的天池、SODA、WID、數據嗨客等。
最后就是實習。實習最優選擇應該是數據公司的數據崗,然而現實是這樣的崗位由于太過重要,基本不會招實習生。所以建議找一些統計量化相關的或者計算機相關的實習。

? 2025. All Rights Reserved. 滬ICP備2023009024號-1