有個(gè)比賽能讓你快速入門并掌握機(jī)器學(xué)習(xí)和數(shù)據(jù)分析方法,實(shí)操實(shí)戰(zhàn)解決真實(shí)企業(yè)的商業(yè)問題,助你收獲實(shí)習(xí)、科研、留學(xué)offer。還有機(jī)會(huì)拿下高達(dá)50000美金的獎(jiǎng)勵(lì),和全球頂尖的數(shù)據(jù)科學(xué)家決戰(zhàn)光明頂。
學(xué)術(shù)活動(dòng)介紹
Kaggle成立于2010年,是一個(gè)進(jìn)行數(shù)據(jù)發(fā)掘和預(yù)測(cè)學(xué)術(shù)活動(dòng)的在線平臺(tái)。從公司的角度來講,可以提供一些數(shù)據(jù),進(jìn)而提出一個(gè)實(shí)際需要解決的問題;從參賽者的角度來講,他們將組隊(duì)參與項(xiàng)目,針對(duì)其中一個(gè)問題提出解決方案,
最終由公司選出的最佳方案可以獲得5K-10K美金的獎(jiǎng)金。 除此之外,Kaggle官方每年還會(huì)舉辦一次大規(guī)模的學(xué)術(shù)活動(dòng),獎(jiǎng)金高達(dá)一百萬美金,吸引了廣大的數(shù)據(jù)科學(xué)愛好者參與其中。但是不同于傳統(tǒng)的低層次勞動(dòng)力需求,
Kaggle一直致力于解決業(yè)界難題,因此也創(chuàng)造了一種全新的勞動(dòng)力市場(chǎng)——不再以學(xué)歷和工作經(jīng)驗(yàn)作為唯一的人才評(píng)判標(biāo)準(zhǔn),而是著眼于個(gè)人技能,為頂尖人才和公司之間搭建了一座橋梁。
只要你有才,只要你能解決問題,藤校offer和頂級(jí)互聯(lián)網(wǎng)公司入職加薪均有可能。
適合人群
適合對(duì)date science、date mining、machine learning感興趣的高中生;
有一定計(jì)算機(jī)背景的人群。是絕佳提升申請(qǐng)背景的賽事。
賽事說明
賽題示例
Allstate索賠預(yù)測(cè)挑戰(zhàn)?- 使用客戶的購(gòu)物歷史記錄來預(yù)測(cè)他們購(gòu)買的保險(xiǎn)單
有害評(píng)論分類挑戰(zhàn)?- 預(yù)測(cè)維基百科上有害評(píng)論的存在和類型
Zillow獎(jiǎng)?- 構(gòu)建一個(gè)機(jī)器學(xué)習(xí)算法,可以挑戰(zhàn)Zesow,Zillow房地產(chǎn)價(jià)格估算算法
谷歌地標(biāo)檢索挑戰(zhàn) - 如果有圖像,您能在數(shù)據(jù)集中找到所有相同的地標(biāo)嗎?
右鯨識(shí)別 - 識(shí)別航空照片中瀕臨滅絕的露脊鯨
大規(guī)模分層文本分類 - 將維基百科文檔分類為約300,000個(gè)類別之一
泰坦尼克號(hào):從災(zāi)難中進(jìn)行機(jī)器學(xué)習(xí),預(yù)測(cè)泰坦尼克號(hào)的生存幾率
房?jī)r(jià)預(yù)測(cè):回歸方法
貓與狗:創(chuàng)建一種算法去區(qū)分貓與狗
紐約出租車行程持續(xù)時(shí)間:通過數(shù)據(jù)改善乘車時(shí)間預(yù)測(cè)
商店銷售預(yù)測(cè)
新用戶預(yù)定預(yù)測(cè)
基本流程
注冊(cè)賬號(hào)(一人只能有一個(gè)賬號(hào))
選擇一個(gè)比賽項(xiàng)目
加入學(xué)術(shù)活動(dòng),理解項(xiàng)目需求
下載數(shù)據(jù),訓(xùn)練模型,得出結(jié)果
提交結(jié)果(一般只需提交預(yù)測(cè)結(jié)果,每天可多次提交)
一直到時(shí)間截至,評(píng)出最優(yōu)者
獲獎(jiǎng)的隊(duì)伍必須提交源代碼
注:上傳過一次結(jié)果之后,就直接加入了這場(chǎng)比賽。正式比賽中每個(gè)團(tuán)隊(duì)每天有5次的上傳機(jī)會(huì),然后就要等24小時(shí)再次傳結(jié)果,playground的是9次。
比賽技能要求
編程語(yǔ)言:最基礎(chǔ)的入門學(xué)者也得先學(xué)會(huì)初步使用一門編程語(yǔ)言。對(duì)于毫無基礎(chǔ)的新手,推薦使用Python,因?yàn)镻ython作為一種強(qiáng)大的膠水語(yǔ)言,可以迅速入門。
探索數(shù)據(jù):除編程語(yǔ)言外,還需要學(xué)習(xí)如何探索性分析你手上的數(shù)據(jù),這是進(jìn)入數(shù)據(jù)科學(xué)的第一步。因?yàn)橥ǔ5绞值臄?shù)據(jù)都多到不可思議,你要學(xué)會(huì)取舍和迅速獲取最有用的信息。
模型訓(xùn)練:熟悉使用機(jī)器學(xué)習(xí)庫(kù),培養(yǎng)良好的習(xí)慣,為之后的工作做鋪墊實(shí)戰(zhàn):從初級(jí)可以逐漸增加難度。
比賽形式
Classic:在比賽開始后,用戶可以訪問完整的數(shù)據(jù)集。并可以選擇在本地或在線進(jìn)行建模、預(yù)測(cè)生成預(yù)測(cè)文件,最后提交預(yù)測(cè)結(jié)果。目前大多數(shù)比賽采取本形式。
Two-stage:分為第一階段和第二階段,第二階段建立在第一階段的結(jié)果上,第一階段完成才可參加第二階段。
Kernels:參賽者必須在線提交代碼,更加公平,使每個(gè)參賽者都使用相同配置的電腦。
參賽時(shí)間
全年滾動(dòng),隨時(shí)可以報(bào)名。
學(xué)術(shù)活動(dòng)含金量
從留學(xué)申請(qǐng)者的角度來看:
對(duì)于申請(qǐng)Data Science相關(guān)專業(yè)的同學(xué)來講,大數(shù)據(jù)的走紅使得Data Science的申請(qǐng)競(jìng)爭(zhēng)愈演愈烈,因此如何提升背景也是大家非常關(guān)心的問題。而Kaggle正好給大家提供了一個(gè)非常好的平臺(tái),在這里人人有參與項(xiàng)目的機(jī)會(huì),無論你的背景是什么,都可以通過選擇合適的項(xiàng)目來找到屬于自己的位置,利用自己的專業(yè)優(yōu)勢(shì),為整個(gè)team作出貢獻(xiàn),豐富簡(jiǎn)歷的同時(shí)也能學(xué)習(xí)一些干貨,為自己以后的學(xué)習(xí)打好基礎(chǔ)。而其在領(lǐng)域內(nèi)的知名度足以讓你在眾多申請(qǐng)者中脫穎而出,絕對(duì)是申請(qǐng)利器!
從求職者的角度來看:
Kaggle提供了一個(gè)非常好的學(xué)習(xí)平臺(tái),在這里你可以接觸到真正的業(yè)界案例,收獲實(shí)際的項(xiàng)目經(jīng)驗(yàn),在每一個(gè)項(xiàng)目中不斷挑戰(zhàn)自己,甚至在Kaggle榜上占據(jù)一席之位,提高自己在業(yè)內(nèi)的知名度,優(yōu)秀的排位甚至可能帶來的非常好的工作機(jī)會(huì)。
同時(shí),也可以認(rèn)識(shí)一群志同道合的人,擴(kuò)展自己的professional network,與業(yè)內(nèi)最頂尖的高手互動(dòng),尤其是很多隊(duì)伍在比賽結(jié)束后都會(huì)公開自己的解法,如果這個(gè)項(xiàng)目恰好你參與過,為之投入過無數(shù)個(gè)日日夜夜,此時(shí)就是不可多得的學(xué)習(xí)機(jī)會(huì)。如果能在Kaggle這種高手云集的比賽中獲得一個(gè)還不錯(cuò)的成績(jī),
寫在簡(jiǎn)歷上足以打動(dòng)你今后的Boss,跳槽就翻倍的高薪工作指日可待!值得一提的是,雖然是匯集精英的社區(qū),Kaggle的論壇氛圍很好,對(duì)新人非常友好,大家一定要多看Script多請(qǐng)教!

? 2026. All Rights Reserved. 滬ICP備2023009024號(hào)-1