CMU探究之利用神經(jīng)網(wǎng)絡(luò)進行圖像分類

Category: STEM國際競賽 Date: 2020年3月19日下午10:14

人們的眼睛通過視神經(jīng)識別圖像，并在腦海中給圖像進行分類。那么在計算機里，什么像是人的視覺神經(jīng)一樣呢？那就是計算機的神經(jīng)網(wǎng)絡(luò)。今天小編想要向大家介紹的課題項目就是CMU探究項目：利用卷積神經(jīng)網(wǎng)絡(luò)進行圖像分類。

課題簡介

圖像分類是根據(jù)圖像的語義信息將不同類別圖像區(qū)分開來，是計算機視覺中重要的基本問題，也是圖像檢測、圖像分割、物體跟蹤、行為分析等其他高層視覺任務(wù)的基礎(chǔ)。圖像分類在很多領(lǐng)域有廣泛應(yīng)用，包括安防領(lǐng)域的人臉識別和智能視頻分析等，交通領(lǐng)域的交通場景識別，互聯(lián)網(wǎng)領(lǐng)域基于內(nèi)容的圖像檢索和相冊自動歸類，醫(yī)學(xué)領(lǐng)域的圖像識別等。

卷積神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)方法中專門用于計算機視覺的一類神經(jīng)網(wǎng)絡(luò)。它是目前解決許多計算機視覺任務(wù)的最優(yōu)方法，其中最典型的是圖像分類問題。圖像分類問題的簡單描述如下：給定一張圖片和備選的幾個類別，計算機能夠自動判斷該圖片屬于備選類別中的哪一類。這個任務(wù)最直接簡單而有效的應(yīng)用場景之一，就是手寫字識別：給定一張手寫圖片，計算機能夠自動識別該圖片是什么字符，從而達到手寫輸入的效果。

MNIST和CIFAR10數(shù)據(jù)集是兩個非常經(jīng)典的圖像分類數(shù)據(jù)集。前者包含0~9共十個數(shù)字手寫體的圖片。后者包含10種物體（比如飛機、汽車、鳥類）的圖片。卷積神經(jīng)網(wǎng)絡(luò)能在這兩個數(shù)據(jù)集上達到非常好的分類效果。

本課題旨在通過在這些數(shù)據(jù)集上完成基本的分類任務(wù)，讓學(xué)生學(xué)習(xí)到卷積神經(jīng)網(wǎng)絡(luò)的原理，包括反向傳播，隨機梯度下降等，且讓學(xué)生基本掌握深度學(xué)習(xí)，并能夠認識到深度學(xué)習(xí)實戰(zhàn)中的各種困難，比如數(shù)據(jù)過擬合。

科研方法

AI＋X數(shù)據(jù)驅(qū)動型科研

使用人工智能（AI）算法，收集、處理、分析具體學(xué)科（X）的海量數(shù)據(jù)，并基于此進行預(yù)測，從而獲得科學(xué)發(fā)現(xiàn)的研究方法。與傳統(tǒng)的、基于實驗或邏輯推理的研究方式相比，AI＋X數(shù)據(jù)驅(qū)動型科研可以借助AI算法強大的運算能力，高效地進行大數(shù)據(jù)分析，具有投入產(chǎn)出比高、適用范圍廣的優(yōu)點。

AI＋X數(shù)據(jù)驅(qū)動型科研已被廣泛地應(yīng)用于各個領(lǐng)域，利用AI算法研究基因數(shù)據(jù)，從而進行早期的癌癥篩查便是其中一例。基因組與癌癥病患的數(shù)據(jù)千千萬萬，使用傳統(tǒng)的科研方式對其進行分析，工程量大、過程繁瑣，在客觀上難以實現(xiàn)。

但借助AI算法這一便捷的工具，生命科學(xué)家便能夠以海量的患者的遺傳信息為基礎(chǔ)，建立數(shù)據(jù)庫，與過往的研究成果進行對照，快速、準確地在兩者中發(fā)現(xiàn)規(guī)律、建立聯(lián)系，從而使癌癥診斷的“標準化”成為可能。