計算機視覺被業內稱為是人工智能在中國落地最順利的技術。和語音相比,計算機視覺是一條更有技術深度,更多應用場景的好賽道;從目前的落地進展來看,移動互聯網/安防領跑,零售/物流跟進,醫療/無人駕駛的商業化有待成熟。
同時,計算機視覺也是中國AI市場的最大組成部分。根據中國信通院2018年2月發布的報告數據,2017年,中國人工智能市場中計算機視覺占比37%,以80億元的行業收入排名第一。從AI領域融資規模來看,根據CBInsight的統計,2016年中國計算機視覺公司融資總額占AI總體24%,遠超出美國的7%。
作為互聯網巨頭,BAT更是利用自家強大的數據優勢和豐富的內部應用場景,早早滲透進計算機視覺領域之中。無論是開放人臉識別算法、試點安防、機場、景區、金融、教育等人臉識別應用、線下門店的刷臉支付等智慧商業的應用、智慧城市等……巨頭們已經翻開新篇章。
1999年,身在美國硅谷的李彥宏感受到了中國互聯網正在發生著翻天覆地的變化,毅然決然地回國成立了百度公司。后來,正如李彥宏所講“互聯網是一道開胃菜,主菜就是人工智能”。百度開始發力人工智能領域。
2014年5月,吳恩達宣布加入百度,負責百度深度學習研究院工作,其中包括李彥宏最重視的百度大腦計劃。在他的帶領下,百度成為了全球為數不多的深度覆蓋人工智能各類應用公司之一,涵蓋了語音、神經語言編程、計算機視覺、機器學習和知識圖譜等多領域專業技術。并創建了兩個新的業務部門:自動駕駛業務部門以及DuerOS會話式計算平臺。
百度全面轉向人工智能,2017年1月,前微軟全球執行副總裁陸奇空降百度,擔任了百度總裁兼首席運營官。陸奇上任后,推進了六項舉措:
(1)裁撤百度移動醫療事業部;
(2)全資收購渡鴉科技;
(3)成立度秘事業部加碼人機交互;
(4)合并自駕部門;
(5)加緊風投團隊落地;
(6)投資蔚來汽車;
正如陸奇所說,百度正在為自己積累數年的人工智能尋找更多的場景落地,并且通過場景和產品找到商業模式。
百度人工智能布局生態是基于百度大腦,百度大腦是一整套的核心能力和核心算法,將語音識別、圖像識別、視頻識別、自然語言處理、大數據、用戶畫像等種種核心能力組裝在一起,給同行業的創業者、創新者賦能。DuerOS是百度AI戰略的重要布局,通過API、SDK為參與者賦能。
計算機視覺作為人工智能領域重要版塊,2017年4月,百度全資收購美國科技公司xPerception。這是一家專注于機器視覺軟硬件解決方案的科技公司,面向機器人、AR/VR、智能導盲等行業客戶提供以立體慣性相機為核心的機器視覺軟硬件產品。
該收購可能與百度試圖加強視覺感知領域的軟硬件能力有關,而這對百度在AR、自動駕駛等核心業務方面都將是重要協同補充。這是百度繼全資收購渡鴉科技后,陸奇上任以來在AI領域的又一重要收購。
百度方面表示,十分看重該公司在機器視覺領域開創性的研究和國際一流的軟硬件成果,此次收購后,xPerception核心團隊都將加入百度研究院,繼續致力于其核心技術慣性視覺定位與構圖(Visual Inertial SLAM)的研發,加速包括AR、自動駕駛、機器人在內的百度人工智能業務矩陣的產業化。
時至2018年,百度在計算機視覺技術上已然有了新突破,正式宣布開放人體分析技術。至此,百度計算機視覺技術已全線開放,包括人臉識別、文字識別(OCR)、圖像審核、圖像識別&圖像搜索5大類別、58項基礎能力,且有近20萬開發者在使用百度的計算機視覺能力。百度AI技術生態部技術經理謝永康介紹,百度計算機視覺技術的全線開放,就是為了幫助開發者和合作伙伴更好地享用AI,助其成功。
百度人體分析技術具備人體關鍵點識別、人體屬性分析、人流量統計、人像分割、手勢識別和駕駛行為分析6大基礎能力,可滿足多個場景的應用需求。這些能力可為安防監控提供人流監測和行為識別;在智慧零售場景,針對客群屬性畫像、顧客軌跡等做出相關分析;在體育、娛樂互動方面,通過人體識別可產生更多創新應用;甚至可以通過垂直場景能力對駕駛員行為和乘客進行監測分析,降低酒后駕車、超載、疲勞駕駛等多種危險駕駛行為,更好地保障司機與乘客安全。
為了滿足特定場景需要,人體分析配合人臉識別可以產生化學反應,打造出更多可能性。比如,零售場景可以實現會員識別與非會員客流分析,在安防監控應用上也可以通過身份識別、行為識別等方式為人們筑起更高的“安全之墻”。
除此之外,備受關注的落地應用——百度自動駕駛,經過多年技術研發投入也取得了突破性進展:從2017年4月,隨著Apollo的發布,百度的自動駕駛走上“正軌”;進入2018年,隨著各地陸續放開自動駕駛路測資格,百度收獲頗豐。3月拿下北京、福建(平潭縣)首批路測牌照,4月又獲得了重慶的牌照。2018年的百度AI開發者大會和百度世界大會,李彥宏親自為Apollo站臺,讓外界看到了Apollo的發展速度。再到今年百度AI開發者大會上推出Apollo5.0版本,再次向公眾證明了百度的技術實力。截至目前,百度已經開啟了中國首條L4級自動駕駛乘用車前裝產線的下線投產,并獲得了總數超過100張自動駕駛測試牌照,其中最高技術等級、最高標準和測試場景最難的T4自動駕駛路測牌照的獲得,更是意味著百度Apollo的自動駕駛車輛已經具備了在復雜城市道理進行自動駕駛的能力。
提及阿里巴巴,在中國互聯網界巨頭中,或被認為是技術實力最弱的一家公司。實則不然,正如馬云所言,“我不懂技術,但我們尊重技術,我們信仰技術。”
早在2017年10月11日,阿里巴巴宣布成立全球研究院,從此踏上了科技的征途。
阿里巴巴達摩院(The Academy for Discovery, Adventure, Momentum and Outlook,Alibaba DAMO Academy)是一家致力于探索科技未知,以人類愿景為驅動力的研究院,是阿里在全球多點設立的科研機構,立足基礎科學、顛覆性技術和應用技術的研究。其涵蓋量子計算、機器學習、基礎算法、網絡安全、視覺計算、自然語言處理、人機自然交互、芯片技術、傳感器技術、嵌入式系統等,涵蓋機器智能、智聯網、金融科技等多個產業領域。
不久之前,中國電商巨頭阿里巴巴收購了以色列AR創企Infinity AR,其團隊加入了阿里巴巴的以色列機器視覺計算實驗室。
InfinityAR成立于2013年,總部位于特拉維夫大都市區的Ramat Gan,開發增強現實軟件。Kushnir介紹,2016年,該公司從阿里巴巴和日本娛樂及IT公司Sun Corporation Ltd.籌集了1800萬美元的投資。迄今為止,該公司已籌集了2500萬美元。
Infinity AR 的愿景是建立一個全新的數字世界,讓人們能自然地在物理環境中與增強現實 (AR) 內容互動。使用基本的廉價的簡易立體攝像頭,InfinityAR的技術可將任何設備轉換為內容增強平臺,允許用戶使用自然的手部動作,直觀地與物理環境中的增強內容互動。
阿里巴巴的以色列研發中心是阿里達摩院的一部分,目前在全世界還有7處這樣的研發中心。以色列研發中心由Technion的Lhi Zelnik-Manor教授領導,注重發展計算機視覺、人工智能和機器學習。
目前,達摩院成立已快兩年,在機器視覺領域,機器智能技術實驗室在圖像搜索、大規模圖像識別、視頻分析、線下視覺智能等領域都有所建樹。其中,圖像搜索領域,阿里AI的向量引擎比Facebook快6倍。
機器智能技術實驗室在6月份剛剛結束的WebVision學術活動中,阿里AI以82.54%的識別準確率,擊敗了全世界150多支參賽隊伍,獲得冠軍。機器智能技術實驗室稱,阿里AI目前可以識別超過100萬種物理實體。
WebVison是目前圖像識別領域最權威的學術活動之一,專注于物體識別,被譽為接棒ImageNet的大規模圖像識別學術活動。7月,在CVPR2019舉辦的LPIRC(低功耗圖像識別挑戰賽)中,阿里AI獲得在線圖像分類任務第一名。在挑戰賽使用的訓練數據集上,阿里AI實現了67.4%的分類精度,比官方提供的基準線高3.5%。
在人工智能產業飛速發展的時代,騰訊也吹響了AI的號角。2016年,騰訊成立了AI Lab實驗室,并發布AI即服務的智能云戰略產品,騰訊將人工智能布局在計算機視覺、自然語言處理、語音識別的三大領域。騰訊在人工智能領域采取了自身研發與戰略投資齊頭并進的方式,延續以往的打法:做連接。比如騰訊小微,就是用來輔助現有的產品和業務。戰略投資方面,主要是技術上的合作和醫療領域的布局。
在騰訊 AI Lab 官網上,列出了四個研究領域:計算機視覺,語音識別,自然語言處理和機器學習。這四方面的技術將支撐 AI Lab 朝上述研究方向行進。與百度和阿里不同,AI Lab 研究方向則注重與騰訊的業務場景相結合。比如騰訊在游戲方面有優勢,而游戲在目前很多 AI 研究中都扮演著重要角色,因為游戲產生的大量模擬數據可以用來開發 AI 能力,而其中的算法還可以沉淀下來,放到實際中去。
早在 AI Lab 成立前,騰訊已有優圖實驗室、What Lab、微信北京研發中心、智能計算與搜索實驗室四個人工智能相關的研發機構。AI Lab 成立后不久,又成立了西雅圖 AI 實驗室。
計算機視覺是人工智能最重要的分支之一,在人工智能的發展中占據關鍵地位。騰訊高級執行副總裁湯道生認為,如果我們在計算機視覺領域取得重要突破,或將推動人工智能迎來質變。
騰訊優圖是騰訊人工智能技術的支柱之一,創立于2012年,專注在圖像處理、模式識別、機器學習、數據挖掘等領域開展技術研發和業務落地。團隊成員將近百人,大都是來自于清華、北大、中科院、上海交大、浙大等頂級院校的博士、碩士。自成立起來,騰訊優圖一直秉承“技術與場景深度融合”的發展理念,除了在QQ、QQ空間等騰訊自有的數十條產品線中落地,還成功為微眾銀行、福建公安廳、順豐、中國聯通、每日優鮮、華星光電、中國國南方電網等輸出AI能力。目前,騰訊優圖的技術已經廣泛應用在醫療、零售、工業、文化等領域。
2018年,湯道生宣布將優圖實驗室升級為騰訊計算機視覺研發中心,持續加碼計算機視覺技術的研發投入。未來,騰訊還會進一步聯合全球產、學、研各方力量,持續推動計算機視覺技術的發展。同時,優圖取得的技術成果也會通過騰訊云平臺開放給上下游的合作伙伴。
騰訊副總裁梁柱等代表騰訊優圖與美國科學促進會官方刊物《科學》(Science)系列期刊進行戰略合作簽約,雙方將達成長期戰略合作伙伴關系,共享在計算機視覺領域的資源和信息,通過產學研之間的無障礙合作,一起推動計算機視覺技術的發展。
值得一提的是,智慧交通同樣也是騰訊AI的落地重點。騰訊“智慧出行”目前已經形成了“四橫兩縱一中臺”的業務矩陣。“智慧出行”作為騰訊輸出的整體解決方案,覆蓋自主出行、共享出行、公共出行場景。四橫指的是四個業務矩陣,包括騰訊車聯、騰訊自動駕駛、騰訊位置服務,騰訊乘車碼;兩縱是指騰訊內容平臺和安全保障系統。而騰訊AI和騰訊云作為中臺,為業務矩陣提供底層保障。
計算機視覺研究的演變,從最初的圖像處理、立體視覺與三維重建、物體檢測和識別,到光度視覺、幾何視覺和語義視覺,到現在的深度學習打遍天下。而各大場景應用也遍地開花,計算機視覺這條賽道上,國內獨角獸企業間互相角力,BAT巨頭也紛紛入局,未來,計算機視覺行業又是否會面臨重新洗牌或推倒重來?2019年,拭目以待。

? 2025. All Rights Reserved. 滬ICP備2023009024號-1