Home » 國際競賽 » Details

留學(xué)申請專業(yè)選擇統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)的區(qū)別

Category: 國際競賽, 國際課程, 留學(xué)考試 Date: 2019年10月12日下午12:54

統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)之間的界定一直很模糊。

無論是業(yè)界還是學(xué)界一直認(rèn)為機(jī)器學(xué)習(xí)只是統(tǒng)計(jì)學(xué)批了一層光鮮的外衣。

而機(jī)器學(xué)習(xí)支撐的人工智能也被稱為“統(tǒng)計(jì)學(xué)的外延”

例如，諾獎得主托馬斯·薩金特曾經(jīng)說過人工智能其實(shí)就是統(tǒng)計(jì)學(xué)，只不過用了一個(gè)很華麗的辭藻。

他在世界科技創(chuàng)新論壇上表示，人工智能其實(shí)就是統(tǒng)計(jì)學(xué)

當(dāng)然也有一些不同的聲音。但是這一觀點(diǎn)的正反雙方在爭吵中充斥著一堆看似高深實(shí)則含糊的論述，著實(shí)讓人摸不著頭腦。

一位名叫Matthew Stewart的哈佛大學(xué)博士生從統(tǒng)計(jì)與機(jī)器學(xué)習(xí)的不同；統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)的不同，這兩個(gè)角度論證了機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)并不是互為代名詞。

與大部分人所想的正相反，機(jī)器學(xué)習(xí)其實(shí)已經(jīng)存在幾十年了。當(dāng)初只是因?yàn)槟菚r(shí)的計(jì)算能力無法滿足它對大量計(jì)算的需求，而漸漸被人遺棄。然而，近年來，由于信息爆炸所帶來的數(shù)據(jù)和算力優(yōu)勢，機(jī)器學(xué)習(xí)正快速復(fù)蘇。

言歸正傳，如果說機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)是互為代名詞，那為什么我們沒有看到每所大學(xué)的統(tǒng)計(jì)學(xué)系都關(guān)門大吉而轉(zhuǎn)投'機(jī)器學(xué)習(xí)'系呢？因?yàn)樗鼈兪遣灰粯拥?

"機(jī)器學(xué)習(xí)和統(tǒng)計(jì)的主要區(qū)別在于它們的目的。機(jī)器學(xué)習(xí)模型旨在使最準(zhǔn)確的預(yù)測成為可能。統(tǒng)計(jì)模型是為推斷變量之間的關(guān)系而設(shè)計(jì)的。

雖然技術(shù)上來說這是正確的，但這樣的論述并沒有給出特別清晰和令人滿意的答案。機(jī)器學(xué)習(xí)和統(tǒng)計(jì)之間的一個(gè)主要區(qū)別確實(shí)是它們的目的。

然而，說機(jī)器學(xué)習(xí)是關(guān)于準(zhǔn)確的預(yù)測，而統(tǒng)計(jì)模型是為推理而設(shè)計(jì)，幾乎是毫無意義的說法，除非你真的精通這些概念。

首先，我們必須明白，統(tǒng)計(jì)和統(tǒng)計(jì)建模是不一樣的。統(tǒng)計(jì)是對數(shù)據(jù)的數(shù)學(xué)研究。除非有數(shù)據(jù)，否則無法進(jìn)行統(tǒng)計(jì)。統(tǒng)計(jì)模型是數(shù)據(jù)的模型，主要用于推斷數(shù)據(jù)中不同內(nèi)容的關(guān)系，或創(chuàng)建能夠預(yù)測未來值的模型。通常情況下，這兩者是相輔相成的。

因此，實(shí)際上我們需要從兩方面來論述：第一，統(tǒng)計(jì)與機(jī)器學(xué)習(xí)有何不同；第二，統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)有何不同？

說的更直白些就是，有很多統(tǒng)計(jì)模型可以做出預(yù)測，但預(yù)測效果比較差強(qiáng)人意。

而機(jī)器學(xué)習(xí)通常會犧牲可解釋性以獲得強(qiáng)大的預(yù)測能力。例如，從線性回歸到神經(jīng)網(wǎng)絡(luò)，盡管解釋性變差，但是預(yù)測能力卻大幅提高。

從宏觀角度來看，這是一個(gè)很好的答案。至少對大多數(shù)人來說已經(jīng)足夠好。然而，在有些情況下，這種說法容易讓我們對機(jī)器學(xué)習(xí)和統(tǒng)計(jì)建模之間的差異產(chǎn)生誤解。讓我們看一下線性回歸的例子。

統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)在線性回歸上的差異：

764799-cfb0a81d1ecd1eaeac0cf623e12517ca

或許是因?yàn)榻y(tǒng)計(jì)建模和機(jī)器學(xué)習(xí)中使用方法的相似性，使人們認(rèn)為它們是同一個(gè)東西。對這我可以理解，但事實(shí)上不是這樣。

最明顯的例子是線性回歸，這可能是造成這種誤解的主要原因。線性回歸是一種統(tǒng)計(jì)方法，通過這種方法我們既可以訓(xùn)練一個(gè)線性回歸器，又可以通過最小二乘法擬合一個(gè)統(tǒng)計(jì)回歸模型。

可以看到，在這個(gè)案例中，前者做的事兒叫"訓(xùn)練"模型，它只用到了數(shù)據(jù)的一個(gè)子集，而訓(xùn)練得到的模型究竟表現(xiàn)如何需要通過數(shù)據(jù)的另一個(gè)子集測試集測試之后才能知道。在這個(gè)例子中，機(jī)器學(xué)習(xí)的最終目的是在測試集上獲得最佳性能。

對于后者，我們則事先假設(shè)數(shù)據(jù)是一個(gè)具有高斯噪聲的線性回歸量，然后試圖找到一條線，最大限度地減少了所有數(shù)據(jù)的均方誤差。不需要訓(xùn)練或測試集，在許多情況下，特別是在研究中(如下面的傳感器示例)，建模的目的是描述數(shù)據(jù)與輸出變量之間的關(guān)系, 而不是對未來數(shù)據(jù)進(jìn)行預(yù)測。我們稱此過程為統(tǒng)計(jì)推斷，而不是預(yù)測。盡管我們可以使用此模型進(jìn)行預(yù)測，這也可能是你所想的，但評估模型的方法不再是測試集，而是評估模型參數(shù)的顯著性和健壯性。

機(jī)器學(xué)習(xí)（這里特指有監(jiān)督學(xué)習(xí)）的目的是獲得一個(gè)可反復(fù)預(yù)測的模型。我們通常不關(guān)心模型是否可以解釋。機(jī)器學(xué)習(xí)只在乎結(jié)果。就好比對公司而言，你的價(jià)值只用你的表現(xiàn)來衡量。而統(tǒng)計(jì)建模更多的是為了尋找變量之間的關(guān)系和確定關(guān)系的顯著性，恰巧迎合了預(yù)測。

有一個(gè)誤解存在了10年：僅基于它們都利用相同的基本概率概念這一事實(shí)，來混淆這兩個(gè)術(shù)語是不合理的。

764799-fb09215f51e3ee921957d3ddadf1dfbb

然而，僅僅基于這兩個(gè)術(shù)語都利用了概率里相同的基本概念這一事實(shí)而將他們混為一談是不合理的。就好比，如果我們僅僅把機(jī)器學(xué)習(xí)當(dāng)作皮了一層光鮮外衣的統(tǒng)計(jì)，我們也可以這樣說：

物理只是數(shù)學(xué)的一種更好聽的說法。

動物學(xué)只是郵票收藏的一種更好聽的說法。

建筑學(xué)只是沙堡建筑的一種更好聽的說法。

這些說法（尤其是最后一個(gè)）非常荒謬，完全混淆了兩個(gè)類似想法的術(shù)語。

實(shí)際上，物理是建立在數(shù)學(xué)基礎(chǔ)上的，理解現(xiàn)實(shí)中的物理現(xiàn)象是數(shù)學(xué)的應(yīng)用。物理學(xué)還包括統(tǒng)計(jì)學(xué)的各個(gè)方面，而現(xiàn)代統(tǒng)計(jì)學(xué)通常是建立在Zermelo-Frankel集合論與測量理論相結(jié)合的框架中，以產(chǎn)生概率空間。它們有很多共同點(diǎn)，因?yàn)樗鼈儊碜韵嗨频钠鹪矗⑦\(yùn)用相似的思想得出一個(gè)邏輯結(jié)論。同樣，建筑學(xué)和沙堡建筑可能有很多共同點(diǎn)，但即使我不是一個(gè)建筑師，也不能給出一個(gè)清晰的解釋，但也看得出它們顯然不一樣。

在我們進(jìn)一步討論之前，需要簡要澄清另外兩個(gè)與機(jī)器學(xué)習(xí)和統(tǒng)計(jì)有關(guān)的常見誤解。這就是人工智能不同于機(jī)器學(xué)習(xí)，數(shù)據(jù)科學(xué)不同于統(tǒng)計(jì)學(xué)。這些都是沒有爭議的問題，所以很快就能說清楚。

以上就是關(guān)于【留學(xué)申請專業(yè)選擇統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)的區(qū)別】的解答，如需了解學(xué)校/賽事/課程動態(tài)，可至翰林教育官網(wǎng)獲取更多信息。

競賽獲獎≠名校offer，但拿下哈佛、MIT、牛劍Offer的學(xué)霸履歷里，都有一個(gè)共同點(diǎn)……