統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)之間的界定一直很模糊。
無論是業(yè)界還是學(xué)界一直認(rèn)為機(jī)器學(xué)習(xí)只是統(tǒng)計(jì)學(xué)批了一層光鮮的外衣。
而機(jī)器學(xué)習(xí)支撐的人工智能也被稱為“統(tǒng)計(jì)學(xué)的外延”
例如,諾獎得主托馬斯·薩金特曾經(jīng)說過人工智能其實(shí)就是統(tǒng)計(jì)學(xué),只不過用了一個(gè)很華麗的辭藻。
他在世界科技創(chuàng)新論壇上表示,人工智能其實(shí)就是統(tǒng)計(jì)學(xué)
當(dāng)然也有一些不同的聲音。但是這一觀點(diǎn)的正反雙方在爭吵中充斥著一堆看似高深實(shí)則含糊的論述,著實(shí)讓人摸不著頭腦。
一位名叫Matthew Stewart的哈佛大學(xué)博士生從統(tǒng)計(jì)與機(jī)器學(xué)習(xí)的不同;統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)的不同,這兩個(gè)角度論證了機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)并不是互為代名詞。
與大部分人所想的正相反,機(jī)器學(xué)習(xí)其實(shí)已經(jīng)存在幾十年了。當(dāng)初只是因?yàn)槟菚r(shí)的計(jì)算能力無法滿足它對大量計(jì)算的需求,而漸漸被人遺棄。然而,近年來,由于信息爆炸所帶來的數(shù)據(jù)和算力優(yōu)勢,機(jī)器學(xué)習(xí)正快速復(fù)蘇。
言歸正傳,如果說機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)是互為代名詞,那為什么我們沒有看到每所大學(xué)的統(tǒng)計(jì)學(xué)系都關(guān)門大吉而轉(zhuǎn)投'機(jī)器學(xué)習(xí)'系呢?因?yàn)樗鼈兪遣灰粯拥?
"機(jī)器學(xué)習(xí)和統(tǒng)計(jì)的主要區(qū)別在于它們的目的。機(jī)器學(xué)習(xí)模型旨在使最準(zhǔn)確的預(yù)測成為可能。統(tǒng)計(jì)模型是為推斷變量之間的關(guān)系而設(shè)計(jì)的。
雖然技術(shù)上來說這是正確的,但這樣的論述并沒有給出特別清晰和令人滿意的答案。機(jī)器學(xué)習(xí)和統(tǒng)計(jì)之間的一個(gè)主要區(qū)別確實(shí)是它們的目的。
然而,說機(jī)器學(xué)習(xí)是關(guān)于準(zhǔn)確的預(yù)測,而統(tǒng)計(jì)模型是為推理而設(shè)計(jì),幾乎是毫無意義的說法,除非你真的精通這些概念。
首先,我們必須明白,統(tǒng)計(jì)和統(tǒng)計(jì)建模是不一樣的。統(tǒng)計(jì)是對數(shù)據(jù)的數(shù)學(xué)研究。除非有數(shù)據(jù),否則無法進(jìn)行統(tǒng)計(jì)。統(tǒng)計(jì)模型是數(shù)據(jù)的模型,主要用于推斷數(shù)據(jù)中不同內(nèi)容的關(guān)系,或創(chuàng)建能夠預(yù)測未來值的模型。通常情況下,這兩者是相輔相成的。
因此,實(shí)際上我們需要從兩方面來論述:第一,統(tǒng)計(jì)與機(jī)器學(xué)習(xí)有何不同;第二,統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)有何不同?
說的更直白些就是,有很多統(tǒng)計(jì)模型可以做出預(yù)測,但預(yù)測效果比較差強(qiáng)人意。
而機(jī)器學(xué)習(xí)通常會犧牲可解釋性以獲得強(qiáng)大的預(yù)測能力。例如,從線性回歸到神經(jīng)網(wǎng)絡(luò),盡管解釋性變差,但是預(yù)測能力卻大幅提高。
從宏觀角度來看,這是一個(gè)很好的答案。至少對大多數(shù)人來說已經(jīng)足夠好。然而,在有些情況下,這種說法容易讓我們對機(jī)器學(xué)習(xí)和統(tǒng)計(jì)建模之間的差異產(chǎn)生誤解。讓我們看一下線性回歸的例子。

或許是因?yàn)榻y(tǒng)計(jì)建模和機(jī)器學(xué)習(xí)中使用方法的相似性,使人們認(rèn)為它們是同一個(gè)東西。對這我可以理解,但事實(shí)上不是這樣。
最明顯的例子是線性回歸,這可能是造成這種誤解的主要原因。線性回歸是一種統(tǒng)計(jì)方法,通過這種方法我們既可以訓(xùn)練一個(gè)線性回歸器,又可以通過最小二乘法擬合一個(gè)統(tǒng)計(jì)回歸模型。
可以看到,在這個(gè)案例中,前者做的事兒叫"訓(xùn)練"模型,它只用到了數(shù)據(jù)的一個(gè)子集,而訓(xùn)練得到的模型究竟表現(xiàn)如何需要通過數(shù)據(jù)的另一個(gè)子集測試集測試之后才能知道。在這個(gè)例子中,機(jī)器學(xué)習(xí)的最終目的是在測試集上獲得最佳性能。
對于后者,我們則事先假設(shè)數(shù)據(jù)是一個(gè)具有高斯噪聲的線性回歸量,然后試圖找到一條線,最大限度地減少了所有數(shù)據(jù)的均方誤差。不需要訓(xùn)練或測試集,在許多情況下,特別是在研究中(如下面的傳感器示例),建模的目的是描述數(shù)據(jù)與輸出變量之間的關(guān)系, 而不是對未來數(shù)據(jù)進(jìn)行預(yù)測。我們稱此過程為統(tǒng)計(jì)推斷,而不是預(yù)測。盡管我們可以使用此模型進(jìn)行預(yù)測,這也可能是你所想的,但評估模型的方法不再是測試集,而是評估模型參數(shù)的顯著性和健壯性。
機(jī)器學(xué)習(xí)(這里特指有監(jiān)督學(xué)習(xí))的目的是獲得一個(gè)可反復(fù)預(yù)測的模型。我們通常不關(guān)心模型是否可以解釋。機(jī)器學(xué)習(xí)只在乎結(jié)果。就好比對公司而言,你的價(jià)值只用你的表現(xiàn)來衡量。而統(tǒng)計(jì)建模更多的是為了尋找變量之間的關(guān)系和確定關(guān)系的顯著性,恰巧迎合了預(yù)測。
有一個(gè)誤解存在了10年:僅基于它們都利用相同的基本概率概念這一事實(shí),來混淆這兩個(gè)術(shù)語是不合理的。

然而,僅僅基于這兩個(gè)術(shù)語都利用了概率里相同的基本概念這一事實(shí)而將他們混為一談是不合理的。就好比,如果我們僅僅把機(jī)器學(xué)習(xí)當(dāng)作皮了一層光鮮外衣的統(tǒng)計(jì),我們也可以這樣說:
物理只是數(shù)學(xué)的一種更好聽的說法。
動物學(xué)只是郵票收藏的一種更好聽的說法。
建筑學(xué)只是沙堡建筑的一種更好聽的說法。
這些說法(尤其是最后一個(gè))非常荒謬,完全混淆了兩個(gè)類似想法的術(shù)語。
實(shí)際上,物理是建立在數(shù)學(xué)基礎(chǔ)上的,理解現(xiàn)實(shí)中的物理現(xiàn)象是數(shù)學(xué)的應(yīng)用。物理學(xué)還包括統(tǒng)計(jì)學(xué)的各個(gè)方面,而現(xiàn)代統(tǒng)計(jì)學(xué)通常是建立在Zermelo-Frankel集合論與測量理論相結(jié)合的框架中,以產(chǎn)生概率空間。它們有很多共同點(diǎn),因?yàn)樗鼈儊碜韵嗨频钠鹪矗⑦\(yùn)用相似的思想得出一個(gè)邏輯結(jié)論。同樣,建筑學(xué)和沙堡建筑可能有很多共同點(diǎn),但即使我不是一個(gè)建筑師,也不能給出一個(gè)清晰的解釋,但也看得出它們顯然不一樣。
在我們進(jìn)一步討論之前,需要簡要澄清另外兩個(gè)與機(jī)器學(xué)習(xí)和統(tǒng)計(jì)有關(guān)的常見誤解。這就是人工智能不同于機(jī)器學(xué)習(xí),數(shù)據(jù)科學(xué)不同于統(tǒng)計(jì)學(xué)。這些都是沒有爭議的問題,所以很快就能說清楚。
以上就是關(guān)于【留學(xué)申請專業(yè)選擇統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)的區(qū)別】的解答,如需了解學(xué)校/賽事/課程動態(tài),可至翰林教育官網(wǎng)獲取更多信息。
往期文章閱讀推薦:
劍橋/布朗/紐約大學(xué)都認(rèn)可!你的高考成績可以同時(shí)叩開英美名校的大門!
競賽獲獎≠名校offer,但拿下哈佛、MIT、牛劍Offer的學(xué)霸履歷里,都有一個(gè)共同點(diǎn)……

? 2026. All Rights Reserved. 滬ICP備2023009024號-1