Kaggle是一個在計算機科學領域非常著名的學術活動平臺,它被譽為CS界的AMC,無論你是哪個專業,只要對計算機科學感興趣,就應該了解一下Kaggle這個平臺。它以其有趣的學術活動題目、不限制年齡、背景和國籍的參賽資格、快速入門和高質量的學術活動內容而受到了廣大學子的熱愛。
學術活動介紹
Kaggle成立于2010年,是一個進行數據發掘和預測學術活動的在線平臺。從公司的角度來講,可以提供一些數據,進而提出一個實際需要解決的問題;從參賽者的角度來講,他們將組隊參與項目,針對其中一個問題提出解決方案,最終由公司選出的最佳方案可以獲得5K-10K美金的獎金。
除此之外,Kaggle官方每年還會舉辦一次大規模的學術活動,獎金高達一百萬美金,吸引了廣大的數據科學愛好者參與其中。從某種角度來講,大家可以把它理解為一個眾包平臺,類似國內的豬八戒。但是不同于傳統的低層次勞動力需求,Kaggle一直致力于解決業界難題,因此也創造了一種全新的勞動力市場——不再以學歷和工作經驗作為唯一的人才評判標準,而是著眼于個人技能,為頂尖人才和公司之間搭建了一座橋梁。
學術活動含金量
助力名校申請
一段帶獎金高難度的Kaggle比賽的 Prize Winner經歷并不會比一段互聯網大廠數據分析實習經歷遜色,Kaggle項目可以直觀地展現你的數據分析能力。Kaggle作為數據科學行業極富盛名的平臺,在業界具有極高的認可度。在找相關工作時,一段Kaggle Prize Winner經歷將大大提高你的錄取概率。
學界認可度
得益于Kaggle的海量數據集和開放性,它還成為了一個非常棒的教學實踐平臺,吸引到哥大、紐大、上交大等設立了相關領域的Capstone Project,以及哈佛、牛津、斯坦福等開設Kaggle-in-Class的課程項目。
Kaggle優勢
Kaggle交流社區的活躍度非常高,許多優秀選手會在社區里開源代碼、分享心得,一起成長
Kaggle會根據每場比賽的排名,受到許多企業認可
比賽全英文,可以練習英語
業界含金量高
許多科技巨頭在Kaggle舉辦Recruitment類的學術活動用于招聘數據科學家,比如?Facebook、Amazon、Walmart。
Featured類的比賽為解決商業問題而設立,是Kaggle平臺最主要的學術活動類型,獎金高競爭激烈,有金銀銅牌獎勵,對參賽選手的能力有一定的要求,同時這意味著如果可以取得較好的成績排名,對于相關領域的申請、求職能起到很強的背書。
報名及了解更多Kaggle內容,請咨詢小助手,免費獲取歷年考題

學術活動詳細內容
學術活動要求:
編程語言
最基礎的入門學者也需要學會初步使用一門編程語言。對于毫無基礎的新手,推薦使用Python,因為Python作為一種強大的膠水語言,可迅速入門。
探索數據
光有編程語言是不夠的,還需要學習如何探索性分析你手上的數據,這是進入數據科學的第一步。因為通常到手的數據都多到不可思議,你要學會取舍和迅速獲取最有用的信息。
模型訓練
熟悉使用機器學習庫,培養良好的習慣,為之后的工作做鋪墊實戰,從初級可以逐漸增加難度。
參賽時間
全年滾動,隨時可以報名
適合人群
對數據科學、數據挖掘、機器學習感興趣的高中生
有一定計算機背景的大學生
學術活動流程:
注冊賬號(一人只能有一個賬號)
選擇想要參賽的項目
下載題目的數據
時間截止,評出最優者
獲獎的隊伍必須提交源代碼
注:可以以個人或組隊的形式參加比賽,在參賽時可以相互分享經驗。
比賽形式 :
Classic:在比賽開始后,用戶可以訪問完整的數據集。并可以選擇在本地或在線進行建模、預測生成預測文件,最后提交預測結果。目前大多數比賽采取本形式。
Two-stage:分為第一階段和第二階段,第二階段建立在第一階段的結果上,第一階段完成才可參加第二階段。
Kernels:參賽者必須在線提交代碼,更加公平,使每個參賽者都使用相同配置的電腦。
學術活動獎項設置
kaggle的評價體系 kaggle的用戶評價體系是基于三個維度的:學術活動、代碼以及社區參與。根據這三個維度把kaggle的用戶分成了5個等級:
Novice :初始等級,只要注冊就算
Contributor :添加資料信息,并且進行了各種指定的動作即可。如上兩個等級沒有考慮到用戶的比賽成績和社區聲望。
Expert :獲得兩枚學術活動銅牌;5枚代碼銅牌;以及50枚討論銅牌
Master :獲得一枚學術活動金牌,兩枚學術活動銀牌;10枚代碼銀牌;50枚討論銀牌以及總共200枚討論獎牌
Grandmaster :獲得5枚學術活動金牌,solo學術活動金牌;15枚代碼金牌;50枚討論金牌以及總共500枚討論獎牌。

? 2025. All Rights Reserved. 滬ICP備2023009024號-1