課題名稱(chēng)
面向智能交互的圖像識(shí)別技術(shù)綜述與展望
視覺(jué)在人與人交互以及人與自然界的交互過(guò)程中起到非常重要的作用,讓終端設(shè)備具有智能的視覺(jué)識(shí)別和交互能力是人工智能和計(jì)算機(jī)技術(shù)的核心挑戰(zhàn)和遠(yuǎn)大目標(biāo)之一.可以看到,近年來(lái)視覺(jué)識(shí)別技術(shù)發(fā)展飛速,新的創(chuàng)新技術(shù)不斷涌現(xiàn),新的研究問(wèn)題不斷被提出,面向智能交互的應(yīng)用呈現(xiàn)出一些新的動(dòng)態(tài),正在不斷刷新人們對(duì)此領(lǐng)域的原有認(rèn)識(shí)。從視覺(jué)識(shí)別、視覺(jué)描述和視覺(jué)問(wèn)答3個(gè)角度對(duì)圖像識(shí)別技術(shù)進(jìn)行綜述,對(duì)基于深度學(xué)習(xí)的圖像識(shí)別以及場(chǎng)景分類(lèi)技術(shù)進(jìn)行了具體介紹,對(duì)視覺(jué)描述和問(wèn)答技術(shù)的最新技術(shù)進(jìn)行了分析和討論,同時(shí)對(duì)面向移動(dòng)終端和機(jī)器人的視覺(jué)識(shí)別和交互應(yīng)用進(jìn)行了介紹,最后對(duì)該領(lǐng)域的未來(lái)研究趨勢(shì)進(jìn)行了分析。
漢語(yǔ)大詞匯量連續(xù)語(yǔ)音識(shí)別系統(tǒng)研究進(jìn)展
大詞匯量連續(xù)語(yǔ)音識(shí)別(LVCSR)技術(shù)近年來(lái)發(fā)展迅速,并在許多領(lǐng)域得到了廣泛的應(yīng)用,國(guó)內(nèi)外許多大公司加大了對(duì)語(yǔ)音識(shí)別技術(shù)的研究,不少商業(yè)化的語(yǔ)音識(shí)別系統(tǒng)已經(jīng)面世,并得到較為廣泛的使用。該文綜述了近年來(lái)大詞匯量連續(xù)語(yǔ)音識(shí)別技術(shù)的研究進(jìn)展,描述了漢語(yǔ)大詞匯量連續(xù)語(yǔ)音識(shí)別系統(tǒng),主要是基于統(tǒng)計(jì)方法的語(yǔ)音識(shí)別系統(tǒng)的框架與設(shè)計(jì)方法,對(duì)語(yǔ)音識(shí)別系統(tǒng)的一些關(guān)鍵技術(shù)和原理進(jìn)行了分析,并對(duì)近年來(lái)國(guó)內(nèi)外對(duì)語(yǔ)音識(shí)別研究發(fā)展動(dòng)向進(jìn)行了討論。
大數(shù)據(jù)下的機(jī)器學(xué)習(xí)算法綜述
隨著產(chǎn)業(yè)界數(shù)據(jù)量的爆炸式增長(zhǎng),大數(shù)據(jù)概念受到越來(lái)越多的關(guān)注.由于大數(shù)據(jù)的海量、復(fù)雜多樣、變化快的特性,對(duì)于大數(shù)據(jù)環(huán)境下的應(yīng)用問(wèn)題,傳統(tǒng)的在小數(shù)據(jù)上的機(jī)器學(xué)習(xí)算法很多已不再適用.因此,研究大數(shù)據(jù)環(huán)境下的機(jī)器學(xué)習(xí)算法成為學(xué)術(shù)界和產(chǎn)業(yè)界共同關(guān)注的話(huà)題.文中主要分析和總結(jié)當(dāng)前用于處理大數(shù)據(jù)的機(jī)器學(xué)習(xí)算法的研究現(xiàn)狀.此外,并行是處理大數(shù)據(jù)的主流方法,因此介紹一些并行算法,并引出大數(shù)據(jù)環(huán)境下機(jī)器學(xué)習(xí)研究所面臨的問(wèn)題.最后指出大數(shù)據(jù)機(jī)器學(xué)習(xí)的研究趨勢(shì).

? 2025. All Rights Reserved. 滬ICP備2023009024號(hào)-1