Home » 國際競賽 » Details

BAT計(jì)算機(jī)視覺布局盤點(diǎn)

Category: 國際競賽, 國際課程, 計(jì)算機(jī)國際競賽 Date: 2019年8月19日上午11:57

計(jì)算機(jī)視覺被業(yè)內(nèi)稱為是人工智能在中國落地最順利的技術(shù)。和語音相比，計(jì)算機(jī)視覺是一條更有技術(shù)深度，更多應(yīng)用場景的好賽道；從目前的落地進(jìn)展來看，移動互聯(lián)網(wǎng)/安防領(lǐng)跑，零售/物流跟進(jìn)，醫(yī)療/無人駕駛的商業(yè)化有待成熟。

同時(shí)，計(jì)算機(jī)視覺也是中國AI市場的最大組成部分。根據(jù)中國信通院2018年2月發(fā)布的報(bào)告數(shù)據(jù)，2017年，中國人工智能市場中計(jì)算機(jī)視覺占比37%，以80億元的行業(yè)收入排名第一。從AI領(lǐng)域融資規(guī)模來看，根據(jù)CBInsight的統(tǒng)計(jì)，2016年中國計(jì)算機(jī)視覺公司融資總額占AI總體24%，遠(yuǎn)超出美國的7%。

作為互聯(lián)網(wǎng)巨頭，BAT更是利用自家強(qiáng)大的數(shù)據(jù)優(yōu)勢和豐富的內(nèi)部應(yīng)用場景，早早滲透進(jìn)計(jì)算機(jī)視覺領(lǐng)域之中。無論是開放人臉識別算法、試點(diǎn)安防、機(jī)場、景區(qū)、金融、教育等人臉識別應(yīng)用、線下門店的刷臉支付等智慧商業(yè)的應(yīng)用、智慧城市等……巨頭們已經(jīng)翻開新篇章。

百度：AI是主菜

1999年，身在美國硅谷的李彥宏感受到了中國互聯(lián)網(wǎng)正在發(fā)生著翻天覆地的變化，毅然決然地回國成立了百度公司。后來，正如李彥宏所講“互聯(lián)網(wǎng)是一道開胃菜，主菜就是人工智能”。百度開始發(fā)力人工智能領(lǐng)域。

2014年5月，吳恩達(dá)宣布加入百度，負(fù)責(zé)百度深度學(xué)習(xí)研究院工作，其中包括李彥宏最重視的百度大腦計(jì)劃。在他的帶領(lǐng)下，百度成為了全球?yàn)閿?shù)不多的深度覆蓋人工智能各類應(yīng)用公司之一，涵蓋了語音、神經(jīng)語言編程、計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)和知識圖譜等多領(lǐng)域?qū)I(yè)技術(shù)。并創(chuàng)建了兩個(gè)新的業(yè)務(wù)部門：自動駕駛業(yè)務(wù)部門以及DuerOS會話式計(jì)算平臺。

百度全面轉(zhuǎn)向人工智能，2017年1月，前微軟全球執(zhí)行副總裁陸奇空降百度，擔(dān)任了百度總裁兼首席運(yùn)營官。陸奇上任后，推進(jìn)了六項(xiàng)舉措：

（1）裁撤百度移動醫(yī)療事業(yè)部；

（2）全資收購渡鴉科技；

（3）成立度秘事業(yè)部加碼人機(jī)交互；

（4）合并自駕部門；

（5）加緊風(fēng)投團(tuán)隊(duì)落地；

（6）投資蔚來汽車；

正如陸奇所說，百度正在為自己積累數(shù)年的人工智能尋找更多的場景落地，并且通過場景和產(chǎn)品找到商業(yè)模式。

百度人工智能布局生態(tài)是基于百度大腦，百度大腦是一整套的核心能力和核心算法，將語音識別、圖像識別、視頻識別、自然語言處理、大數(shù)據(jù)、用戶畫像等種種核心能力組裝在一起，給同行業(yè)的創(chuàng)業(yè)者、創(chuàng)新者賦能。DuerOS是百度AI戰(zhàn)略的重要布局，通過API、SDK為參與者賦能。

計(jì)算機(jī)視覺作為人工智能領(lǐng)域重要版塊，2017年4月，百度全資收購美國科技公司xPerception。這是一家專注于機(jī)器視覺軟硬件解決方案的科技公司，面向機(jī)器人、AR/VR、智能導(dǎo)盲等行業(yè)客戶提供以立體慣性相機(jī)為核心的機(jī)器視覺軟硬件產(chǎn)品。

該收購可能與百度試圖加強(qiáng)視覺感知領(lǐng)域的軟硬件能力有關(guān)，而這對百度在AR、自動駕駛等核心業(yè)務(wù)方面都將是重要協(xié)同補(bǔ)充。這是百度繼全資收購渡鴉科技后，陸奇上任以來在AI領(lǐng)域的又一重要收購。

百度方面表示，十分看重該公司在機(jī)器視覺領(lǐng)域開創(chuàng)性的研究和國際一流的軟硬件成果，此次收購后，xPerception核心團(tuán)隊(duì)都將加入百度研究院，繼續(xù)致力于其核心技術(shù)慣性視覺定位與構(gòu)圖（Visual Inertial SLAM）的研發(fā)，加速包括AR、自動駕駛、機(jī)器人在內(nèi)的百度人工智能業(yè)務(wù)矩陣的產(chǎn)業(yè)化。

時(shí)至2018年，百度在計(jì)算機(jī)視覺技術(shù)上已然有了新突破，正式宣布開放人體分析技術(shù)。至此，百度計(jì)算機(jī)視覺技術(shù)已全線開放，包括人臉識別、文字識別（OCR）、圖像審核、圖像識別&圖像搜索5大類別、58項(xiàng)基礎(chǔ)能力，且有近20萬開發(fā)者在使用百度的計(jì)算機(jī)視覺能力。百度AI技術(shù)生態(tài)部技術(shù)經(jīng)理謝永康介紹，百度計(jì)算機(jī)視覺技術(shù)的全線開放，就是為了幫助開發(fā)者和合作伙伴更好地享用AI，助其成功。

百度人體分析技術(shù)具備人體關(guān)鍵點(diǎn)識別、人體屬性分析、人流量統(tǒng)計(jì)、人像分割、手勢識別和駕駛行為分析6大基礎(chǔ)能力，可滿足多個(gè)場景的應(yīng)用需求。這些能力可為安防監(jiān)控提供人流監(jiān)測和行為識別；在智慧零售場景，針對客群屬性畫像、顧客軌跡等做出相關(guān)分析；在體育、娛樂互動方面，通過人體識別可產(chǎn)生更多創(chuàng)新應(yīng)用；甚至可以通過垂直場景能力對駕駛員行為和乘客進(jìn)行監(jiān)測分析，降低酒后駕車、超載、疲勞駕駛等多種危險(xiǎn)駕駛行為，更好地保障司機(jī)與乘客安全。

為了滿足特定場景需要，人體分析配合人臉識別可以產(chǎn)生化學(xué)反應(yīng)，打造出更多可能性。比如，零售場景可以實(shí)現(xiàn)會員識別與非會員客流分析，在安防監(jiān)控應(yīng)用上也可以通過身份識別、行為識別等方式為人們筑起更高的“安全之墻”。

除此之外，備受關(guān)注的落地應(yīng)用——百度自動駕駛，經(jīng)過多年技術(shù)研發(fā)投入也取得了突破性進(jìn)展：從2017年4月，隨著Apollo的發(fā)布，百度的自動駕駛走上“正軌”；進(jìn)入2018年，隨著各地陸續(xù)放開自動駕駛路測資格，百度收獲頗豐。3月拿下北京、福建(平潭縣)首批路測牌照，4月又獲得了重慶的牌照。2018年的百度AI開發(fā)者大會和百度世界大會，李彥宏親自為Apollo站臺，讓外界看到了Apollo的發(fā)展速度。再到今年百度AI開發(fā)者大會上推出Apollo5.0版本，再次向公眾證明了百度的技術(shù)實(shí)力。截至目前，百度已經(jīng)開啟了中國首條L4級自動駕駛乘用車前裝產(chǎn)線的下線投產(chǎn)，并獲得了總數(shù)超過100張自動駕駛測試牌照，其中最高技術(shù)等級、最高標(biāo)準(zhǔn)和測試場景最難的T4自動駕駛路測牌照的獲得，更是意味著百度Apollo的自動駕駛車輛已經(jīng)具備了在復(fù)雜城市道理進(jìn)行自動駕駛的能力。

阿里巴巴：信仰技術(shù)

提及阿里巴巴，在中國互聯(lián)網(wǎng)界巨頭中，或被認(rèn)為是技術(shù)實(shí)力最弱的一家公司。實(shí)則不然，正如馬云所言，“我不懂技術(shù)，但我們尊重技術(shù)，我們信仰技術(shù)。”

早在2017年10月11日，阿里巴巴宣布成立全球研究院，從此踏上了科技的征途。

阿里巴巴達(dá)摩院（The Academy for Discovery, Adventure, Momentum and Outlook，Alibaba DAMO Academy）是一家致力于探索科技未知，以人類愿景為驅(qū)動力的研究院，是阿里在全球多點(diǎn)設(shè)立的科研機(jī)構(gòu)，立足基礎(chǔ)科學(xué)、顛覆性技術(shù)和應(yīng)用技術(shù)的研究。其涵蓋量子計(jì)算、機(jī)器學(xué)習(xí)、基礎(chǔ)算法、網(wǎng)絡(luò)安全、視覺計(jì)算、自然語言處理、人機(jī)自然交互、芯片技術(shù)、傳感器技術(shù)、嵌入式系統(tǒng)等，涵蓋機(jī)器智能、智聯(lián)網(wǎng)、金融科技等多個(gè)產(chǎn)業(yè)領(lǐng)域。

不久之前，中國電商巨頭阿里巴巴收購了以色列AR創(chuàng)企Infinity AR，其團(tuán)隊(duì)加入了阿里巴巴的以色列機(jī)器視覺計(jì)算實(shí)驗(yàn)室。

InfinityAR成立于2013年，總部位于特拉維夫大都市區(qū)的Ramat Gan，開發(fā)增強(qiáng)現(xiàn)實(shí)軟件。Kushnir介紹，2016年，該公司從阿里巴巴和日本娛樂及IT公司Sun Corporation Ltd.籌集了1800萬美元的投資。迄今為止，該公司已籌集了2500萬美元。

Infinity AR 的愿景是建立一個(gè)全新的數(shù)字世界，讓人們能自然地在物理環(huán)境中與增強(qiáng)現(xiàn)實(shí) (AR) 內(nèi)容互動。使用基本的廉價(jià)的簡易立體攝像頭，InfinityAR的技術(shù)可將任何設(shè)備轉(zhuǎn)換為內(nèi)容增強(qiáng)平臺，允許用戶使用自然的手部動作，直觀地與物理環(huán)境中的增強(qiáng)內(nèi)容互動。

阿里巴巴的以色列研發(fā)中心是阿里達(dá)摩院的一部分，目前在全世界還有7處這樣的研發(fā)中心。以色列研發(fā)中心由Technion的Lhi Zelnik-Manor教授領(lǐng)導(dǎo)，注重發(fā)展計(jì)算機(jī)視覺、人工智能和機(jī)器學(xué)習(xí)。

目前，達(dá)摩院成立已快兩年，在機(jī)器視覺領(lǐng)域，機(jī)器智能技術(shù)實(shí)驗(yàn)室在圖像搜索、大規(guī)模圖像識別、視頻分析、線下視覺智能等領(lǐng)域都有所建樹。其中，圖像搜索領(lǐng)域，阿里AI的向量引擎比Facebook快6倍。

機(jī)器智能技術(shù)實(shí)驗(yàn)室在6月份剛剛結(jié)束的WebVision學(xué)術(shù)活動中，阿里AI以82.54%的識別準(zhǔn)確率，擊敗了全世界150多支參賽隊(duì)伍，獲得冠軍。機(jī)器智能技術(shù)實(shí)驗(yàn)室稱，阿里AI目前可以識別超過100萬種物理實(shí)體。

WebVison是目前圖像識別領(lǐng)域最權(quán)威的學(xué)術(shù)活動之一，專注于物體識別，被譽(yù)為接棒ImageNet的大規(guī)模圖像識別學(xué)術(shù)活動。7月，在CVPR2019舉辦的LPIRC（低功耗圖像識別挑戰(zhàn)賽）中，阿里AI獲得在線圖像分類任務(wù)第一名。在挑戰(zhàn)賽使用的訓(xùn)練數(shù)據(jù)集上，阿里AI實(shí)現(xiàn)了67.4%的分類精度，比官方提供的基準(zhǔn)線高3.5%。

騰訊：業(yè)務(wù)場景結(jié)合

在人工智能產(chǎn)業(yè)飛速發(fā)展的時(shí)代，騰訊也吹響了AI的號角。2016年，騰訊成立了AI Lab實(shí)驗(yàn)室，并發(fā)布AI即服務(wù)的智能云戰(zhàn)略產(chǎn)品，騰訊將人工智能布局在計(jì)算機(jī)視覺、自然語言處理、語音識別的三大領(lǐng)域。騰訊在人工智能領(lǐng)域采取了自身研發(fā)與戰(zhàn)略投資齊頭并進(jìn)的方式，延續(xù)以往的打法：做連接。比如騰訊小微，就是用來輔助現(xiàn)有的產(chǎn)品和業(yè)務(wù)。戰(zhàn)略投資方面，主要是技術(shù)上的合作和醫(yī)療領(lǐng)域的布局。

在騰訊 AI Lab 官網(wǎng)上，列出了四個(gè)研究領(lǐng)域：計(jì)算機(jī)視覺，語音識別，自然語言處理和機(jī)器學(xué)習(xí)。這四方面的技術(shù)將支撐 AI Lab 朝上述研究方向行進(jìn)。與百度和阿里不同，AI Lab 研究方向則注重與騰訊的業(yè)務(wù)場景相結(jié)合。比如騰訊在游戲方面有優(yōu)勢，而游戲在目前很多 AI 研究中都扮演著重要角色，因?yàn)橛螒虍a(chǎn)生的大量模擬數(shù)據(jù)可以用來開發(fā) AI 能力，而其中的算法還可以沉淀下來，放到實(shí)際中去。

早在 AI Lab 成立前，騰訊已有優(yōu)圖實(shí)驗(yàn)室、What Lab、微信北京研發(fā)中心、智能計(jì)算與搜索實(shí)驗(yàn)室四個(gè)人工智能相關(guān)的研發(fā)機(jī)構(gòu)。AI Lab 成立后不久，又成立了西雅圖 AI 實(shí)驗(yàn)室。

計(jì)算機(jī)視覺是人工智能最重要的分支之一，在人工智能的發(fā)展中占據(jù)關(guān)鍵地位。騰訊高級執(zhí)行副總裁湯道生認(rèn)為，如果我們在計(jì)算機(jī)視覺領(lǐng)域取得重要突破，或?qū)⑼苿尤斯ぶ悄苡瓉碣|(zhì)變。

騰訊優(yōu)圖是騰訊人工智能技術(shù)的支柱之一，創(chuàng)立于2012年，專注在圖像處理、模式識別、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域開展技術(shù)研發(fā)和業(yè)務(wù)落地。團(tuán)隊(duì)成員將近百人，大都是來自于清華、北大、中科院、上海交大、浙大等頂級院校的博士、碩士。自成立起來，騰訊優(yōu)圖一直秉承“技術(shù)與場景深度融合”的發(fā)展理念，除了在QQ、QQ空間等騰訊自有的數(shù)十條產(chǎn)品線中落地，還成功為微眾銀行、福建公安廳、順豐、中國聯(lián)通、每日優(yōu)鮮、華星光電、中國國南方電網(wǎng)等輸出AI能力。目前，騰訊優(yōu)圖的技術(shù)已經(jīng)廣泛應(yīng)用在醫(yī)療、零售、工業(yè)、文化等領(lǐng)域。

2018年，湯道生宣布將優(yōu)圖實(shí)驗(yàn)室升級為騰訊計(jì)算機(jī)視覺研發(fā)中心，持續(xù)加碼計(jì)算機(jī)視覺技術(shù)的研發(fā)投入。未來，騰訊還會進(jìn)一步聯(lián)合全球產(chǎn)、學(xué)、研各方力量，持續(xù)推動計(jì)算機(jī)視覺技術(shù)的發(fā)展。同時(shí)，優(yōu)圖取得的技術(shù)成果也會通過騰訊云平臺開放給上下游的合作伙伴。

騰訊副總裁梁柱等代表騰訊優(yōu)圖與美國科學(xué)促進(jìn)會官方刊物《科學(xué)》（Science）系列期刊進(jìn)行戰(zhàn)略合作簽約，雙方將達(dá)成長期戰(zhàn)略合作伙伴關(guān)系，共享在計(jì)算機(jī)視覺領(lǐng)域的資源和信息，通過產(chǎn)學(xué)研之間的無障礙合作，一起推動計(jì)算機(jī)視覺技術(shù)的發(fā)展。

值得一提的是，智慧交通同樣也是騰訊AI的落地重點(diǎn)。騰訊“智慧出行”目前已經(jīng)形成了“四橫兩縱一中臺”的業(yè)務(wù)矩陣。“智慧出行”作為騰訊輸出的整體解決方案，覆蓋自主出行、共享出行、公共出行場景。四橫指的是四個(gè)業(yè)務(wù)矩陣，包括騰訊車聯(lián)、騰訊自動駕駛、騰訊位置服務(wù)，騰訊乘車碼；兩縱是指騰訊內(nèi)容平臺和安全保障系統(tǒng)。而騰訊AI和騰訊云作為中臺，為業(yè)務(wù)矩陣提供底層保障。

計(jì)算機(jī)視覺研究的演變，從最初的圖像處理、立體視覺與三維重建、物體檢測和識別，到光度視覺、幾何視覺和語義視覺，到現(xiàn)在的深度學(xué)習(xí)打遍天下。而各大場景應(yīng)用也遍地開花，計(jì)算機(jī)視覺這條賽道上，國內(nèi)獨(dú)角獸企業(yè)間互相角力，BAT巨頭也紛紛入局，未來，計(jì)算機(jī)視覺行業(yè)又是否會面臨重新洗牌或推倒重來？2019年，拭目以待。

以上就是關(guān)于【BAT計(jì)算機(jī)視覺布局盤點(diǎn)】的解答，如需了解學(xué)校/賽事/課程動態(tài)，可至翰林教育官網(wǎng)獲取更多信息。

往期文章閱讀推薦：

NOAI人工智能奧賽 2026-2027 活動章程出爐：新規(guī)則必看！

NOAI、UKOAI、USAAIO三大AI奧賽新賽季全面啟動：留學(xué)申請的“核武器”來了！