拓撲數據分析是拓撲學和數據科學相結合得到的技術,它被廣泛應用于計算幾何學問題,在生物學和醫學領域也同樣被廣泛應用。今天小編想要向大家介紹一下翰林國際教育的一個學研項目:【科研論文】走進大數據之拓撲數據分析方法。
拓撲數據分析(Topological Data Analysis, TDA)是拓撲學和數據科學相結合得到的技術,按定義,TDA是以持續同調(persistent homology)為基礎,對數據的拓撲學特征(topological features)進行分析的方法。TDA的一般性目的是從高維數據中提取有效信息,按機器學習觀點屬于非監督學習和表征學習。其分析過程不會引起信息的損失,且被認為對缺失和噪聲樣本穩定。由于TDA的分析對象是獨立于度量(metric)的拓撲學特征(按一般用語可表述為“抽象的形狀”、“點與點之間的關系”),因此TDA能夠整合并協同分析不同度量(坐標)下的數據集。TDA被應用于計算幾何學問題,例如3D掃描器輸出的點云(point cloud)數據的分析、重建和可視化。在生物信息學和醫學領域,例如癌癥基因樣本的研究中也有應用。
適合學生
高中生、本科生、研究生(國內外均可)
適合專業
數學/應用數學/大數據/數據科學
項目形式
每個課題配備海外名校教授、課題助教、Mentor共同作為導師
課題簡介
在過去的幾年里,商業、科學和技術的許多進步都依賴于深度學習和人工智能的驚人進步。這些成就更加彰顯了在各種實際情況下產生的大數據分析、提取和應用的重要性。拓撲數據分析(TDA),顧名思義,就是把拓撲學與數據分析結合的一種分析方法,用于深入研究大數據中潛藏的有價值的關系。拓撲學研究的是一些特殊的幾何性質,這些性質在圖形連續改變形狀后還能繼續保持不變,稱為“拓撲性質”,而在復雜的高維數據內部也存在著類似的結構性質。相比于主成分分析、聚類分析這些常用的方法,TDA 不僅可以有效地捕捉高維數據空間的拓撲信息,而且擅長發現一些用傳統方法無法發現的小分類,具有更大的研究價值。在本課程中,教授將帶領大家學習基本的拓撲數據分析知識,并講述更多實際應用案例,在理論與實踐相結合的基礎上,幫助學生實現學以致用。
本課程主要目標包括:
★ 學習拓撲的基本理論和技術
★ 拓撲理論在數據科學領域的實際應用
★ 通過問題的解決,提升自我科研分析能力,擴大知識理解范圍
★ 如何進科學調研以及如何撰寫科研報告和學術文章
課程安排
week 1: 拓撲數據分析的一般原理;Metric spaces 度量空間
week 2: 拓撲概念I;拓撲概念II
week 3: 相關問題和解決方案
week 4: 科研報告:基本原則和選題分析;持續同源性
week 5: 拓撲數據分析的實際應用I;拓撲數據分析的實際應用II
week 6: 總結和科研報告展示
【科研論文】走進大數據之拓撲數據分析方法的相關內容就介紹到這里了,由于名額有限,感興趣的同學趕快來報名參加吧。
報名/咨詢科研課題詳情
請識別下方二維碼

? 2025. All Rights Reserved. 滬ICP備2023009024號-1