南加利福尼亞大學簡稱南加大(USC),是美國西海岸最古老的頂尖私立研究型大學,是美國大學協會和環太平洋大學聯盟成員? 。 南加大常年被U.S.News評為全美本科最難被錄取的大學之一。并且南加大在硅谷校友人數位居全美高校第四,被美國國土安全部選為第一所國土安全卓越中心。今天小編想要為大家介紹倆個南加大的科研探究項目。
課題簡介
自然語言處理(Natural Language Processing)是計算機科學領域與人工智能領域中的一個重要研究方向。以實現人與計算機之間通過自然語言進行有效通信為研究目的,通過統計學的方法,利用計算機處理大規模自然語言數據。自然語言處理是一門融合計算語言學、計算機科學、數學于一體的科學,其研究有廣泛的應用,包括語音識別、自然語言理解、自然語言生成、機器翻譯、對話系統等。
情感分析通常使用自然語言處理技術,識別客戶評論的語義情感,語句表達的情緒正負面,或者通過分析語音及文字判斷其表達的情感等來完成廣義上的主觀分析。經過初步的學習了解機器學習之后,學生可以獨立利用開源數據庫對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程,如從電影評論中分析用戶對電影的評價。
本次課題結合機器學習和自然語言處理兩門學科,在幫助學生加深對數學線性代數和機器學習重要算法應用了解的同時,還可以讓學生利用所學知識對機器學習中向量機算法構建數學模型對詞語情感進行分析探究。最后對比其他主流算法,幫助學生進行結果預測和對結果預測的原因分析。
科研方法
AI+X數據驅動型科研
使用人工智能(AI)算法,收集、處理、分析具體學科(X)的海量數據,并基于此進行預測,從而獲得科學發現的研究方法。與傳統的、基于實驗或邏輯推理的研究方式相比,AI+X數據驅動型科研可以借助AI算法強大的運算能力,高效地進行大數據分析,具有投入產出比高、適用范圍廣的優點。
AI+X數據驅動型科研已被廣泛地應用于各個領域,利用AI算法研究基因數據,從而進行早期的癌癥篩查便是其中一例。基因組與癌癥病患的數據千千萬萬,使用傳統的科研方式對其進行分析,工程量大、過程繁瑣,在客觀上難以實現。
但借助AI算法這一便捷的工具,生命科學家便能夠以海量的患者的遺傳信息為基礎,建立數據庫,與過往的研究成果進行對照,快速、準確地在兩者中發現規律、建立聯系,從而使癌癥診斷的“標準化”成為可能。
授課導師
南加州大學 計算機專業碩士
南加大計算機專業碩士在讀;
本科計算機與應用數學雙專業畢業于倫斯勒理工學院;
曾研究韓語識別算法研究,英語字詞變換研究;
本科期間獲得院長優秀學生嘉許名單
課題要求
本課題適合: 9-12 年級學生,有較強的邏輯思維和抽象思維能力:
英文:
具備基本的學術英語閱讀能力;
接觸過英文寫作,能初步撰寫英文文章;
數學:
概率統計基礎知識;
線性回歸;
微積分基礎;
線性代數;
計算機:
Python NLTK;
Python編程基礎;
Numpy庫基礎;
Scikit-learn;
課題簡介
深度學習(Deep Learning)是人工智能(Artificial Intelligence)近幾年最熱門的研究領域。這個領域內接連誕生了AlphaGo、人臉識別、無人駕駛汽車等重量級應用,掀起了一場席卷全世界的科技革命浪潮。深度學習,顧名思義,就是利用多層卷積神經網絡(Convolutional Neural Network)對海量數據進行運算分析的技術。深度學習在很多領域展現了強大的應用能力,在某些試聽識別中的表現甚至超越了人類專家。
圖像分類(Image Classification)是深度學習中應用最早也是應用最為廣泛的部分,由于現實世界中圖像分類問題的數據量往往很小,所以常常通過遷移學習 (Transfer Learning)來完成。近幾年來,深度學習已經成為很多圖像研究者們的首選方法,很多討論深度學習技術的文章被收錄在頂級學術雜志期刊如Nature、Science、Cell中。
作為深度學習中應用最廣泛的部分,圖像分類的意義可以說舉足輕重。事實上,深度卷積神經網絡模型在2012年橫空出世將圖像分類的最高級別的比賽ImageNet的準確率提高了不止一個檔次。自此,每年的冠軍模型都是基于深度卷積神經網絡開發出來的,并且在2015年,圖像分類的準確率已經高于了人類。
本課題旨在介紹深度卷積神經網絡結構,并且就從ImageNet數據集當中挑選一小部分作為突破口,來探究深度學習的來龍去脈。除此之外,本課題還緊跟學術前沿,介紹當下流行的幾種準確率最高的模型,并且比較它們之間的區別。
本課題還介紹遷移學習的目的及必要性、應用成熟的模型對數據集進行調試的方法,并且比較圖像分類方法的準確率,旨在讓學生從理論到實踐全面了解深度學習。
科研方法
AI+X數據驅動型科研
使用人工智能(AI)算法,收集、處理、分析具體學科(X)的海量數據,并基于此進行預測,從而獲得科學發現的研究方法。與傳統的、基于實驗或邏輯推理的研究方式相比,AI+X數據驅動型科研可以借助AI算法強大的運算能力,高效地進行大數據分析,具有投入產出比高、適用范圍廣的優點。
AI+X數據驅動型科研已被廣泛地應用于各個領域,利用AI算法研究基因數據,從而進行早期的癌癥篩查便是其中一例。基因組與癌癥病患的數據千千萬萬,使用傳統的科研方式對其進行分析,工程量大、過程繁瑣,在客觀上難以實現。
但借助AI算法這一便捷的工具,生命科學家便能夠以海量的患者的遺傳信息為基礎,建立數據庫,與過往的研究成果進行對照,快速、準確地在兩者中發現規律、建立聯系,從而使癌癥診斷的“標準化”成為可能。
授課導師
南加州大學生物醫學工程專業博士
南加州大學生物醫學工程專業博士在讀;
研究方向為使用機器學習算法分類生物醫學影像;
現擔任USC生物醫學工程專業助教。
課題要求
本課題適合: 9-12 年級學生,有較強的邏輯思維和抽象思維能力:
英文:
具備基本的學術英語閱讀能力;
接觸過英文寫作,有論文寫作經驗者更佳;
數學:
線性代數基礎;
概率統計基礎知識;
計算機:
Python編程基礎
Numpy庫基礎
Matplotlib庫基礎
Pytorch編程基礎
報名/咨詢課題詳情
請識別下方二維碼

? 2025. All Rights Reserved. 滬ICP備2023009024號-1