在Kaggle平臺上,經常有好多個比賽可供選擇。如下圖所示,為正在進行比賽的截圖。那么對于入門同學(從沒參加過一次Kaggle比賽)如何選擇一場適合的比賽呢?

本文將對Kaggle平臺上的比賽按照類型進行劃分,并對每種類型的比賽進行介紹??傆幸粋€比賽適合你,文末還給出了快速上手Kaggle比賽的指南。
比賽類型
在Kaggle平臺上比賽按照維度劃分為:

按照比賽的形式:比賽可以劃分為Getting Started、PlayGround、Research和Featured四類。其中Getting Started是難度最低的比賽,非常適合入門學習,比如TItanic和House Prices。

PlayGround類型的比賽難度稍微高一點,但難度也不會太高,適合針對特定問題進行深度學習。比如Dogs vs. Cats就是典型的圖像分類的學習賽。

Research比賽是學術類型的比賽,Featured是商業公司的比賽。這兩類比賽在賽題背景和難度上都更難,適合深入學習。需要注意的是,在Kaggle中只有Research和Featured類型的比賽會累計積分和獎牌。

按照比賽階段:比賽可以劃分為One-Stage、Two-Stage和Kernel賽,或者分為非Kernel賽和Kernle賽。非Kernel賽通過選手提交預測結果文件進行打分,Kernel賽需要選手通過Notebook進行預測打分。

需要注意的是,Kernel賽的Notebook提交是有運行時間和聯網要求限制的。所以Kernel賽的復雜度會更高一些。在選擇一個賽題時,可以根據自身的基礎來選擇,也可以根據賽題的要求進行選擇。
比賽頁面
在Kaggle平臺上,舉辦方將每一個比賽都劃分為如下的頁面。在Notebooks頁面中會有參賽選手公開的Notebook,也可以自己新建一個運行。

學習路線
對于入門學習Kaggle的同學來說,在選擇好一場比賽之后,如何開始學習呢?這個要跟自身的知識背景出發。

如果你對賽題數據/任務比較熟悉,那么直接可以下載數據集開始建模;反之可以查看賽題的Notebook頁面和Discussion頁面找到其他選手分享的資源。然后就可以按照如下流程開始:理解賽題內容、賽題數據、特種工程、構建模型和模型集成,不斷迭代提高模型精度。

以Kaggle上的Real or Not? NLP with Disaster Tweets為例,這個比賽是一個對推特上推文進行分類的比賽,具體來說是NLP領域中的文本分類比賽。如果你對文本分類有一點了解,那么就可以直接上手做了。
按照文本分類的思路,可以按照如下思路迭代模型:

好的,本文就到這里。希望大家能找到適合自己的比賽,并參與其中學有所成。
如果你對選什么學術活動沒有目標,歡迎前來咨詢 雅思托福、國際學術活動/課程、夏校,牛劍面試等【免費領取】相關真題及解析!


? 2025. All Rights Reserved. 滬ICP備2023009024號-1