馬里蘭大學(xué)如何通過(guò)人機(jī)協(xié)作讓計(jì)算機(jī)更好地回答問(wèn)題

Category: 國(guó)際競(jìng)賽, 申請(qǐng)求職, 計(jì)算機(jī)國(guó)際競(jìng)賽 Date: 2019年8月13日下午4:49

日前，美國(guó)馬里蘭大學(xué)（University of Maryland、UMD）的研究人員已經(jīng)發(fā)現(xiàn)如何通過(guò)人機(jī)協(xié)作可靠地挑戰(zhàn)計(jì)算機(jī)語(yǔ)言，反映了人類(lèi)語(yǔ)言的復(fù)雜性。他們開(kāi)發(fā)了包含1200多個(gè)問(wèn)題的數(shù)據(jù)集，雖然問(wèn)題很簡(jiǎn)單，但仍困擾著當(dāng)今最強(qiáng)大的計(jì)算機(jī)應(yīng)答系統(tǒng)。學(xué)習(xí)掌握這些問(wèn)題的系統(tǒng)將比目前存在的任何系統(tǒng)對(duì)語(yǔ)言有更好的理解。

人工智能的終極目標(biāo)之一是讓機(jī)器真正理解人類(lèi)的語(yǔ)言，并從復(fù)雜、細(xì)微的字句中詮釋語(yǔ)意。當(dāng)2011年IBM的Watson電腦擊敗著名的《危險(xiǎn)邊緣》（電視智力學(xué)術(shù)活動(dòng)節(jié)目）冠軍肯·詹寧斯（Ken Jennings）時(shí)，似乎就已達(dá)到了這一目標(biāo)。但是，任何嘗試過(guò)與虛擬助手Siri進(jìn)行對(duì)話(huà)的人都知道，要真正理解人類(lèi)語(yǔ)言，計(jì)算機(jī)還有很長(zhǎng)的路要走。因此為了更好地理解人類(lèi)語(yǔ)言，計(jì)算機(jī)系統(tǒng)必須訓(xùn)練挑戰(zhàn)這些問(wèn)題，并完整地反映人類(lèi)語(yǔ)言的復(fù)雜性。

馬里蘭大學(xué)的研究人員已經(jīng)發(fā)現(xiàn)如何通過(guò)人機(jī)協(xié)作可靠地創(chuàng)建這些問(wèn)題，并開(kāi)發(fā)了一個(gè)包含1200多個(gè)問(wèn)題的數(shù)據(jù)集，雖然問(wèn)題易于回答，但仍難倒了當(dāng)今最好的計(jì)算機(jī)應(yīng)答系統(tǒng)。學(xué)習(xí)掌握這些問(wèn)題的系統(tǒng)將比目前存在的任何系統(tǒng)能對(duì)語(yǔ)言有更好的理解。這項(xiàng)研究已發(fā)表在2019年出版的《計(jì)算語(yǔ)言學(xué)協(xié)會(huì)學(xué)報(bào)》上。

該論文的資深作者、UMD計(jì)算機(jī)科學(xué)副教授Jordan Boyd-Graber說(shuō)：“大多數(shù)的計(jì)算機(jī)問(wèn)答系統(tǒng)并沒(méi)有解釋為什么它們會(huì)這樣回答問(wèn)題，但我們的工作幫助我們了解計(jì)算機(jī)實(shí)際理解的內(nèi)容。此外，我們還開(kāi)發(fā)了一個(gè)數(shù)據(jù)集，用于測(cè)試計(jì)算機(jī)，這些數(shù)據(jù)集將揭示計(jì)算機(jī)語(yǔ)言系統(tǒng)是否真的在閱讀并能執(zhí)行與人類(lèi)相同的處理。”

目前大多數(shù)改進(jìn)計(jì)算機(jī)問(wèn)答程序的工作都是由工作人員或計(jì)算機(jī)來(lái)生成問(wèn)題。這些方法存在的固有問(wèn)題是，當(dāng)人們寫(xiě)問(wèn)題時(shí)，并不知道問(wèn)題的哪些特定元素會(huì)混淆計(jì)算機(jī)。而計(jì)算機(jī)編寫(xiě)問(wèn)題時(shí)，要么編寫(xiě)公式化的、填空式的問(wèn)題，一旦出錯(cuò)，就會(huì)產(chǎn)生毫無(wú)意義的結(jié)果。

為了開(kāi)發(fā)人類(lèi)與計(jì)算機(jī)共同工作創(chuàng)建問(wèn)題的新方法，Jordan Boyd-Graber及其團(tuán)隊(duì)創(chuàng)建了一個(gè)計(jì)算機(jī)界面，當(dāng)開(kāi)發(fā)人員輸入一個(gè)問(wèn)題時(shí)，該界面能顯示計(jì)算機(jī)在“思考”什么，然后開(kāi)發(fā)人員再編輯問(wèn)題來(lái)利用計(jì)算機(jī)的弱點(diǎn)。

在新界面中，當(dāng)人類(lèi)輸入問(wèn)題時(shí)，計(jì)算機(jī)的猜測(cè)會(huì)按順序顯示在屏幕上，并突出顯示導(dǎo)致計(jì)算機(jī)做出猜測(cè)的單詞。

例如，如果輸入“哪位作曲家的海頓主題變奏曲是受到卡爾·費(fèi)迪南德·波爾的啟發(fā)？”，而系統(tǒng)正確地回答了“約翰內(nèi)斯·勃拉姆斯”，那么界面會(huì)突出顯示“費(fèi)迪南德·波爾”這個(gè)詞，表明是這個(gè)短語(yǔ)引導(dǎo)它找到了答案。利用這些信息，人們可以再次編輯問(wèn)題，讓計(jì)算機(jī)在不改變問(wèn)題含義的情況下更難回答正確。在這個(gè)例子中，把“卡爾·費(fèi)迪南德·波爾”換成了對(duì)他工作的描述“維也納音樂(lè)協(xié)會(huì)的檔案管理員”，計(jì)算機(jī)就無(wú)法正確回答。顯然，專(zhuān)業(yè)的人類(lèi)智力游戲玩家仍然可以輕松正確地回答重新編輯后的問(wèn)題。

通過(guò)合作，人類(lèi)和計(jì)算機(jī)可靠地開(kāi)發(fā)了1213個(gè)計(jì)算機(jī)難題，研究人員在一場(chǎng)比賽中對(duì)經(jīng)驗(yàn)豐富的人類(lèi)選手進(jìn)行了測(cè)試，其中包括從大學(xué)初級(jí)校隊(duì)到《危險(xiǎn)邊緣》的冠軍，即使是最弱的團(tuán)隊(duì)也擊敗了最強(qiáng)的計(jì)算機(jī)系統(tǒng)。

“近三四年來(lái)，人們已逐漸意識(shí)到計(jì)算機(jī)問(wèn)答系統(tǒng)非常脆弱，且易被愚弄，但這是我們所知的第一篇真正使用機(jī)器來(lái)幫助人類(lèi)打破模型的論文。”該論文的共同作者UMD計(jì)算機(jī)科學(xué)研究生石峰（音譯）說(shuō)。

研究人員表示，這些問(wèn)題不僅可以作為計(jì)算機(jī)專(zhuān)家更好地理解自然語(yǔ)言處理失敗的新數(shù)據(jù)集，還可以作為開(kāi)發(fā)改進(jìn)的機(jī)器學(xué)習(xí)算法的訓(xùn)練數(shù)據(jù)集。這些問(wèn)題揭示了持續(xù)困擾計(jì)算機(jī)的六種不同語(yǔ)言現(xiàn)象。

這六種現(xiàn)象分為兩類(lèi)。第一類(lèi)是語(yǔ)言現(xiàn)象：釋義（例如說(shuō)“l(fā)eap from a precipice”而不是“jump from a cliff”，但釋義均為“從懸崖跳下來(lái)”）；分散注意力的語(yǔ)言或語(yǔ)意的背景（例如在與政治無(wú)關(guān)的線(xiàn)索中引用政治人物）。第二類(lèi)是推理技巧：需要邏輯和計(jì)算的線(xiàn)索，對(duì)問(wèn)題中的元素進(jìn)行三角剖分，或?qū)⒍鄠€(gè)步驟組合在一起形成結(jié)論。

Jordan Boyd-Graber 表示，“人類(lèi)能進(jìn)行更多地概括，并看到更深層次的聯(lián)系。雖然人類(lèi)沒(méi)有計(jì)算機(jī)的無(wú)限內(nèi)存，但仍然有優(yōu)勢(shì)能夠通過(guò)局部看到整體。把計(jì)算機(jī)遇到的問(wèn)題分類(lèi)，有助于理解我們需要解決的問(wèn)題，這樣才能真正讓計(jì)算機(jī)開(kāi)始通過(guò)局部看到整體，并以人類(lèi)的方式回答問(wèn)題。”

Jordan Boyd-Graber補(bǔ)充道，要實(shí)現(xiàn)這一目標(biāo)還有很長(zhǎng)的路要走，這篇論文列出了未來(lái)幾年的研究議程，這樣能讓電腦更好地回答問(wèn)題。他目前就職于馬里蘭大學(xué)高級(jí)計(jì)算機(jī)研究所（UMIACS）以及UMD的信息研究學(xué)院和語(yǔ)言科學(xué)中心，這項(xiàng)研究提供的新工具，將幫助計(jì)算機(jī)科學(xué)家實(shí)現(xiàn)這一目標(biāo)。

以上就是關(guān)于【馬里蘭大學(xué)如何通過(guò)人機(jī)協(xié)作讓計(jì)算機(jī)更好地回答問(wèn)題】的解答，如需了解學(xué)校/賽事/課程動(dòng)態(tài)，可至翰林教育官網(wǎng)獲取更多信息。

NOAI、UKOAI、USAAIO三大AI奧賽新賽季全面啟動(dòng)：留學(xué)申請(qǐng)的“核武器”來(lái)了！