如果問CS領域哪個學術活動最出名,有相當一部分高中生會首先想到Kaggle。在2010年創(chuàng)立的Kaggle是全球頂級的權威性數據科學學術活動平臺,也是當今最大的數據科學家、機器學習開發(fā)者社區(qū),專注于舉辦數據科學周邊的線上學術活動,行業(yè)地位獨一無二。
由于題目有趣,不限年齡、背景和國籍,入門快且含金量高等優(yōu)勢,Kaggle學術活動倍受留學生們的熱捧。不過Kaggle雖好,但如果對它沒有深入了解,很難在比賽中獲得好名次!
01 Kaggle有哪些有趣的題目含金量如何?
Kaggle學術活動不止中學生可以參加,所有計算機愛好者,甚至計算機領域的從業(yè)人員都可以報名,再加上它需要從大型數據庫里找到命題所需要的數據,還需要用最合適的方式將數據整編出來,想脫穎而出確實有一定難度。
具體情況我們可以通過以下3個案例了解。
案例1

比如有一個相對簡單一些的題目,是關于泰坦尼克號的。它的命題框架是,在泰坦尼克號的歷史背景中,里面一共有2000名乘客,這些乘客的體質、背景和先天條件等都不盡相同,你需要通過提供的所有信息數據,來判斷什么樣的人更有可能在沉船事故中幸存。
這個題目需要參賽人把里面的重要因素挑選出來,主要研究哪些因素會真正影響一個人的存活率,是一個非常典型的統(tǒng)計學問題。
案例2

還有一個命題是說,我們在買房時會考慮很多不同因素,所以題目要求你通過VR或拍照等方式觀測過去或現在市場上不同條件住房的出售情況,再根據給到的俄亥俄州一處居民住宅統(tǒng)計數據,預測這些住宅最后的成交量。
這個題目需要你通過經驗去預測哪些因素會影響住房的成交及成交價格,同時通過匹配因素,比如某套房子與哪些房子類型相似,來預測這間房子的最終成交價格。這也是一個非常典型的統(tǒng)計學與CS匹配相結合的問題。
案例3

第3個題目案例的難度更大一些,它是說Twitter、微博等社交媒體上有時會有用戶發(fā)布報警求助信息,因此社交媒體希望建立一個災難預警識別系統(tǒng),可以快速判斷哪些信息是需要第一時間進行消息擴散救援的。但我們都知道社交媒體上每天用戶發(fā)布的信息量非常大,所以這個題目的難度還是很大的。
通過上述案例可以發(fā)現,Kaggle選定的命題大多是生活和工作中的實際問題,能夠直接跟社會需要的技能銜接,發(fā)散性強,同時還綜合體現學生的邏輯分析能力、編程能力和實踐能力。因此它的含金量非常高,Top 30名校也對其非常認可。
02 哪類學生適合參加Kaggle如何進行備賽?
從前面的內容不難看出,Kaggle適合有一定編程基礎,同時對現實問題有濃厚興趣,并擅長運用所學知識去解決這些問題的學生。
不過,由于Kaggle的獲獎難度比較大,針對性的密集備賽還是很有必要的。
比如我有一個在CS方面很有天賦的學生,他從9年級開始參加計算機奧林匹克學術活動,10年級時已經達到了鉑金水平,但是Kaggle依舊沒辦法自己搞定。
所以如果想在Kaggle中表現好一些,少不了系統(tǒng)性的培訓和老師的1V1指導,有需要的朋友可以了解一下棕櫚貓頭鷹的Kaggle學術活動輔導項目。
此外,即便你在Kaggle里面沒能拿到好的名次,它依舊對你的申請有很大幫助。
03 參加Kaggle的收獲如何運用到申請中?
參加Kaggle的收獲可以通過以下3種方式運用到申請中。
1、掌握的編程語言等技能可為其他活動打基礎;
前面我們提到參加Kaggle需要進行相關培訓,具備一定的編程基礎。從這一角度,備賽過程中學習的編程語言等基礎技能,可以為未來參加其他CS相關科研和獨立項目做準備。
2、產出可以當作作品展示在文書中;
Kaggle與其他學術活動相比最大的亮點在于它兼顧了命題與創(chuàng)新發(fā)散,既提供了切入角度,又給了參賽人充分發(fā)揮的空間,進而從最大程度上保證了產出。
因此,無論最終結果如何,你都解決了一個問題,而你解決這個問題的相關產出,可以當作品用來展示,也可以當作素材寫進文書。
3、證明自身實力,為申請加分;
由于Kaggle能夠綜合體現參賽人的能力,如果你做得足夠好,把作品主頁發(fā)給學校看,會成為申請時的超級加分項!
學術活動時間:每月滾動開賽
【掃碼聯系老師領取報名表】
獲取備賽計劃,考前查缺補漏、重點沖刺
免費領取相關真題及解析,還有一對一學術活動規(guī)劃!


? 2025. All Rights Reserved. 滬ICP備2023009024號-1