隨著科技的發(fā)展,每天每時每刻都有大量數(shù)據(jù)被產(chǎn)生和存儲下來。如何才能把這些數(shù)據(jù)變成有用的信息價值被人類所利用,就會通過一系列的收集、統(tǒng)計、整理、分析、挖掘等方法和技術(shù)來實現(xiàn)整個過程。數(shù)據(jù)科學(xué)是一門交叉的學(xué)科,涉及到很多的領(lǐng)域包括統(tǒng)計學(xué)、數(shù)學(xué)、計算機、人工智能、機器學(xué)習(xí)、數(shù)據(jù)庫、模式識別、可視化技術(shù)等多學(xué)科的知識。大數(shù)據(jù)時代的到來,為各個科學(xué)領(lǐng)域帶來了新的改革。
全球最頂尖管理咨詢公司麥肯錫(McKinsey)出具了一份詳細的分析報告,大數(shù)據(jù)或者數(shù)據(jù)工作者的崗位需求將激增,其中大數(shù)據(jù)科學(xué)家的缺口在140000到190000之間,對于懂得如何利用大數(shù)據(jù)做決策的分析師和經(jīng)理的崗位缺口則將達到1500000!
其中對大數(shù)據(jù)處理需求最旺盛的行業(yè)包括:制藥業(yè)、計算機軟件、互聯(lián)網(wǎng)、科研、IT技術(shù)服務(wù)、生物技術(shù)。事實上,大數(shù)據(jù)工作者可以施展拳腳的領(lǐng)域非常廣泛,從國防部、互聯(lián)網(wǎng)創(chuàng)業(yè)公司到金融機構(gòu),到處需要大數(shù)據(jù)項目來做創(chuàng)新驅(qū)動。數(shù)據(jù)分析或數(shù)據(jù)處理的崗位報酬也非常豐厚,在硅谷,入門級的數(shù)據(jù)科學(xué)家的收入已經(jīng)是6位數(shù)了(美元)。
數(shù)據(jù)科學(xué)的三類職業(yè)方向機器學(xué)習(xí)、數(shù)據(jù)分析和數(shù)據(jù)科學(xué)家
(1)機器學(xué)習(xí)工程師 Machine Learning Engineer
代表了技術(shù)含量較高的方向,工作內(nèi)容主要是開發(fā)機器學(xué)習(xí)系統(tǒng)和用這些系統(tǒng)解決實際問題。一般需要ship production code,做出來的是數(shù)據(jù)產(chǎn)品。
(2)數(shù)據(jù)分析員 Data Analyst
工作內(nèi)容俗稱analytics (product analytics or business analytics),從數(shù)據(jù)中提取insight,估計投資回報比,為產(chǎn)品方向提建議,所用工具一般較基礎(chǔ),比如寫SQL query取數(shù)據(jù)、用R/Python做簡單的分析、用Tableau/Excel作圖比較常見,能自己開發(fā)Dashboard算是analyst里面技術(shù)強的;工作需要產(chǎn)生各種形式的報告;在統(tǒng)計層次上,懂基本t-test和線性回歸即可。
(3)數(shù)據(jù)科學(xué)家 Data Scientist
很多人說,我想做數(shù)據(jù)科學(xué)家,我想做機器學(xué)習(xí),而這類職位就是大家想象中的那種。此類職位工作內(nèi)容以高級建模為主,會針對復(fù)雜的問題來設(shè)計技術(shù)方案,比如Uber叫車的ETA、各種定價系統(tǒng)、Airbnb和金融行業(yè)的Fraud Detection、Amazon物流管理,F(xiàn)B/Linkedin的社交網(wǎng)絡(luò)或者ebay/Airbnb/Uber這樣供需雙方Marketplace市場規(guī)模的實驗。這些例子,聽上去就不是寫SQL能解決的,也不是會寫代碼就能做出來的,都需要比較深的領(lǐng)域知識。
申請MS Data Science 需要什么樣的背景?
不論是陸本還是美本,在本科階段就開設(shè)Data Science這個專業(yè)的學(xué)校并不多,所以大家不要一看自己專業(yè)名字和數(shù)據(jù)科學(xué)不搭邊就覺得是轉(zhuǎn)專業(yè)申請。
首先,本科是計算機科學(xué)CS的同學(xué),是最符合申請條件的,因為大多數(shù)數(shù)據(jù)工作都是通過編程和數(shù)據(jù)庫的相關(guān)手段進行的,同時學(xué)過統(tǒng)計、微積分、高級語言;
例如哈佛大學(xué)對于MSDS的本科背景要求是:希望有微積分、線性代數(shù),熟悉概率和統(tǒng)計干涉、能使用至少1種編程語言,例如Python或R,了解計算機科學(xué)概念。
Prerequisites we expect from applicants include knowledge of calculus and linear algebra, familiarity with probability and statistical inference, fluency in at least one programming language such as python or R, and an understanding of basic computer science concepts.
其次,本科背景是統(tǒng)計、數(shù)學(xué)或應(yīng)用數(shù)學(xué),且有一定編程基礎(chǔ)的同學(xué)也可以申請,這都是很好的專業(yè)匹配。
最后,商科背景出身,但量化背景較強的商科專業(yè),比如金工,但又希望能選擇一個STEM專業(yè)的同學(xué),那DS顯然也是個非常好的選擇。
所以說,如果你有比較強的編程背景,又有比較好的數(shù)理基礎(chǔ),那你就很有競爭力;而純商科背景的同學(xué),如果沒有強的量化背景,或者不懂編程,那建議還是數(shù)據(jù)科學(xué)DS和商業(yè)分析BA混合申請,因為商業(yè)分析更加偏商科,開在商學(xué)院,對商科背景接納程度大很多。
如何加強背景?
建議可以從科研方面加強,在大學(xué)期間最好找和量化相關(guān)的科研,如果實在沒有,可以把相關(guān)的課程大作業(yè)拿來用。再退而求其次,也可以是計算機軟件、數(shù)據(jù)庫相關(guān)。如果沒有科研經(jīng)歷,那將是極大地硬傷。
此外,可以參加一些學(xué)術(shù)活動。學(xué)術(shù)活動的平臺有很多,比如最近很火的Kaggle,再如阿里的天池、SODA、WID、數(shù)據(jù)嗨客等。
最后就是實習(xí)。實習(xí)最優(yōu)選擇應(yīng)該是數(shù)據(jù)公司的數(shù)據(jù)崗,然而現(xiàn)實是這樣的崗位由于太過重要,基本不會招實習(xí)生。所以建議找一些統(tǒng)計量化相關(guān)的或者計算機相關(guān)的實習(xí)。

? 2026. All Rights Reserved. 滬ICP備2023009024號-1