轉(zhuǎn)發(fā)了100次錦鯉,也沒(méi)有一次成為幸運(yùn)男孩/女孩。
好氣,想做個(gè)數(shù)據(jù)模型給自己預(yù)測(cè)下一次轉(zhuǎn)發(fā)中獎(jiǎng)。
你的數(shù)據(jù)集應(yīng)該有至少這樣幾個(gè)要求:
數(shù)據(jù)集不混亂,沒(méi)有過(guò)分多的維度和行列
數(shù)據(jù)相對(duì)干凈,沒(méi)有太多干擾因素
數(shù)據(jù)可以解答一些有趣的問(wèn)題
……OS:這可能比我中獎(jiǎng)還難,還沒(méi)人教
喜歡數(shù)據(jù)科學(xué)和商業(yè)分析的你,一定不要錯(cuò)過(guò)這個(gè)流行權(quán)威,真實(shí)有效的數(shù)據(jù)科學(xué)學(xué)術(shù)活動(dòng)平臺(tái),當(dāng)今最大的數(shù)據(jù)科學(xué)家、機(jī)器學(xué)習(xí)開(kāi)發(fā)者社區(qū)——Kaggle。
這個(gè)學(xué)術(shù)活動(dòng)社區(qū),在全球擁有超過(guò)80萬(wàn)數(shù)據(jù)科學(xué)家的關(guān)注,有眾多知名公司or研究機(jī)構(gòu),發(fā)布自己接近真實(shí)的業(yè)務(wù)/研究數(shù)據(jù)和高額獎(jiǎng)金,懸賞尋求最好最新的解決辦法,甚至給出頂尖的工作機(jī)會(huì)。

而就在17年,以AI為核心業(yè)務(wù)的Google宣布收購(gòu)了Kaggle。再一次證明,這個(gè)積攢起龐大行業(yè)資源和智慧的開(kāi)發(fā)者社區(qū)的被認(rèn)可度和業(yè)內(nèi)實(shí)力。
這是一個(gè)數(shù)據(jù)科學(xué)愛(ài)好者可以展示功力,揚(yáng)名立萬(wàn)的江湖。

選擇一場(chǎng)合適的 Kaggle 比賽 or?playground 數(shù)據(jù)集作為自己的出道項(xiàng)目,能夠——
給轉(zhuǎn)專業(yè)小白帶來(lái)真實(shí)的背景提升
得到一個(gè)被學(xué)界業(yè)界廣泛認(rèn)可的證明
參與到社區(qū)討論,學(xué)到更優(yōu)秀的思考路徑
說(shuō)不定的高額獎(jiǎng)金 or 工作機(jī)會(huì)

官網(wǎng)學(xué)術(shù)活動(dòng)主題頁(yè)展示,可按類別選擇

公司招募

研究主題

初學(xué)者練習(xí)場(chǎng)
Hi你期待的Kaggle學(xué)術(shù)活動(dòng)項(xiàng)目制課程
如果你是一個(gè)打算轉(zhuǎn)行商業(yè)分析 or 數(shù)據(jù)科學(xué)的初學(xué)者,或者一個(gè)想要從事類似職業(yè)但苦于沒(méi)有背景證明的同學(xué),你應(yīng)該為 Kaggle 心動(dòng)了。
你會(huì)猶豫——
我該如何開(kāi)始?
我要和經(jīng)驗(yàn)豐富的數(shù)據(jù)科學(xué)家比賽?
沒(méi)有獲勝機(jī)會(huì)的話,還值得參與嗎?
這就是要為你提供的貼心解決方案了!
Kaggle為喜歡商業(yè)分析和數(shù)據(jù)科學(xué)的同學(xué)提供了非常好的入門(mén)工具和平臺(tái),每個(gè)學(xué)術(shù)活動(dòng)和數(shù)據(jù)都是獨(dú)立的,你無(wú)需考慮項(xiàng)目范圍,而是專注于技能和解決問(wèn)題。而這套技能和解決問(wèn)題的思路,請(qǐng)到了老師帶你——
商業(yè)分析&數(shù)據(jù)科學(xué)?專項(xiàng)輔導(dǎo)1V1
■ 劃重點(diǎn) ■
本次計(jì)劃針對(duì)初學(xué)者,尤其適合各類轉(zhuǎn)專業(yè)小白,想要做更專業(yè)比賽or更深入研究的可以期待我們以后的輔導(dǎo)計(jì)劃~~
亮點(diǎn)引路人+全方位指導(dǎo)
即使是新手小白,也無(wú)須畏懼。邀請(qǐng)到商業(yè)分析&數(shù)據(jù)科學(xué)領(lǐng)域,教育背景優(yōu)秀,實(shí)戰(zhàn)經(jīng)驗(yàn)扎實(shí)的老師,手把手,一步步,全程指導(dǎo),帶你了解 Kaggle , 選取合適又喜歡的數(shù)據(jù)集(拉面的評(píng)分?西雅圖的寵物牌?沃爾瑪?shù)牡谌径蠕N售?),處理數(shù)據(jù),分析數(shù)據(jù),產(chǎn)出屬于你自己的項(xiàng)目報(bào)告。
最終,你的project成果可以直接用于展示,成為你留學(xué)申請(qǐng)路上專業(yè)水平和背景實(shí)力的證明,也可以成為你求職場(chǎng)上的重要升職加薪砝碼~來(lái)這里,你會(huì)收獲——
一份屬于你的機(jī)器學(xué)習(xí)報(bào)告
從數(shù)據(jù)集的清洗和處理,到特征工程,建立模型,調(diào)整參數(shù)等等,這是一個(gè)僅屬于你的機(jī)器學(xué)習(xí)全過(guò)程,最終這份報(bào)告是你技術(shù)實(shí)力和思考寫(xiě)作能力的雙重體現(xiàn)。
掌握數(shù)據(jù)科學(xué)界的核心理論與方法
實(shí)打?qū)嵉臄?shù)據(jù)科學(xué)界的硬技能,既鍛煉你的實(shí)際操作能力,更磨礪你的數(shù)據(jù)分析思維,掌握開(kāi)啟未來(lái)大門(mén)的金鑰匙。
升學(xué)/求職申請(qǐng)利器
貨真價(jià)實(shí)的過(guò)程復(fù)現(xiàn)作品和能力證明材料,無(wú)論遞交給學(xué)校還是企業(yè)方,都能妥妥顯示你就是有兩把刷子的天選之人!
面試官、招生官不僅能「讀到你的經(jīng)歷」,更能實(shí)際地「看到你的過(guò)程」。
以下是本次專項(xiàng)輔導(dǎo)計(jì)劃的詳細(xì)內(nèi)容介紹——
專項(xiàng)輔導(dǎo)內(nèi)容
本次專項(xiàng)輔導(dǎo)計(jì)劃,你將有20個(gè)課時(shí)(1hour/課時(shí))的時(shí)間,與你的專屬導(dǎo)師全程1V1交流溝通,挑選 Kaggle 合適的數(shù)據(jù)集和比賽內(nèi)容,最終完成一份機(jī)器學(xué)習(xí)報(bào)告。
01 對(duì)數(shù)據(jù)進(jìn)行探索性分析
學(xué)生根據(jù)自己的興趣方向和實(shí)際情況,與導(dǎo)師商議,在 Kaggle 上挑選出合適的且令你愉快舒心的數(shù)據(jù)集,了解比賽的內(nèi)容和意義。
不同的數(shù)據(jù)集意味著不同的模型方向,例如分類 or 回歸,包含的各類數(shù)據(jù)?feature 也多種多樣。描述和探索數(shù)據(jù),確定合適的模型,這是你的第一步。
02?數(shù)據(jù)處理
根據(jù)你的使用習(xí)慣,R或者 Python 都可以。對(duì)數(shù)據(jù)進(jìn)行預(yù)先處理,包括清洗數(shù)據(jù),排除noise,?處理缺失值~
03?特征工程
挑選出你想要重點(diǎn)使用的,最理想的 feature 做加工,比如對(duì)數(shù)值型數(shù)據(jù)做簡(jiǎn)單的加減乘除,特征的選擇和聯(lián)合非常關(guān)鍵,要把你的數(shù)據(jù)安排得明明白白的。
04?選擇和建立模型
分出你的訓(xùn)練集和測(cè)試集,選擇和建立起適合你的數(shù)據(jù)的模型。
05?調(diào)參和優(yōu)化
試著跑一跑你的模型,為了提高精準(zhǔn)度,可以在這一步對(duì)你的模型參數(shù)做調(diào)整和優(yōu)化。嘗試不同的組合,選取最優(yōu)值。還可以將多個(gè)模型融合在一起,提高效率。
06?復(fù)現(xiàn)過(guò)程和結(jié)果,產(chǎn)出報(bào)告
最終,你將對(duì)自己的整個(gè)過(guò)程做一遍梳理,復(fù)現(xiàn)過(guò)程和結(jié)果,闡釋每一部分的意義,產(chǎn)出屬于你的機(jī)器學(xué)習(xí)報(bào)告。

我不是你的報(bào)告,我只是個(gè)單純的插圖
經(jīng)典案例舉例
來(lái),我們以一個(gè) Kaggle 上的具體比賽案例,帶你看看你會(huì)得到怎樣的輔導(dǎo)吧。
▌比賽地址鏈接:
https://www.kaggle.com/c/house-prices-advanced-regression-techniques

▌比賽項(xiàng)目描述:
這是一個(gè)房?jī)r(jià)預(yù)測(cè)項(xiàng)目,數(shù)據(jù)集里的變量描述了愛(ài)荷華州埃姆斯的住宅各方面情況,要求你預(yù)測(cè)房子未來(lái)的價(jià)格。
▌比賽項(xiàng)目核心知識(shí)點(diǎn):
極具創(chuàng)意的特征工程
高級(jí)回歸模型:隨機(jī)森林和梯度提升
▌實(shí)踐輔導(dǎo)流程:
小白別方,搓搓手,我們準(zhǔn)備搞事情了~
Step 1?指導(dǎo)你進(jìn)行數(shù)據(jù)集的探索性分析
Step 2?學(xué)習(xí)?Python 或者 R 核心可視化包的應(yīng)用
Step 3?學(xué)會(huì)從現(xiàn)有眾多變量中取其精華,重新安排核心變量
Step 4?劃分訓(xùn)練集和測(cè)試集做交叉驗(yàn)證
Step 5?學(xué)會(huì)應(yīng)用模型并對(duì)其優(yōu)化
Step 6?用 Markdown?的形式來(lái)展現(xiàn)和包裝你的項(xiàng)目
彩蛋環(huán)節(jié):創(chuàng)立自己的 github 頁(yè)面,把你的項(xiàng)目 show 出去!
(github: 數(shù)據(jù)科學(xué)家和程序猿超喜歡超熱愛(ài)的代碼托管網(wǎng)站,宛如一個(gè)公眾號(hào),寫(xiě)進(jìn)自己的簡(jiǎn)歷里十分加分!面試官/招生官可以直接點(diǎn)擊進(jìn)去,感受你的project,原滋原味~)
經(jīng)過(guò)這波淬煉,你一定會(huì)成為被面試官/招生官喜愛(ài)的杰出青年~
適合人群
對(duì)商業(yè)分析、數(shù)據(jù)科學(xué)專業(yè)感興趣的同學(xué)們
計(jì)算機(jī)、經(jīng)濟(jì)、金融、數(shù)學(xué)、物理等各種各樣專業(yè),想要轉(zhuǎn)專業(yè)到商業(yè)分析or數(shù)據(jù)科學(xué)領(lǐng)域,苦于沒(méi)有起步騰飛的學(xué)習(xí)資源的同學(xué)。
求職/求學(xué)已經(jīng)迫在眉睫,急需提升背景的你
對(duì)數(shù)據(jù)科學(xué)、商業(yè)分析、機(jī)器學(xué)習(xí)有非常濃厚的興趣,求職就業(yè)or碩士申請(qǐng)想要跨入這個(gè)領(lǐng)域,卻苦于沒(méi)有相應(yīng)背景,申請(qǐng)異常困難的同學(xué)們。
在數(shù)據(jù)處理和分析工作中沉淪,尋求刺激和提升的職場(chǎng)人士
喜歡數(shù)據(jù)處理和分析工作,想要有更加清晰的成果展現(xiàn),想要老板升職加薪,尋求刺激和個(gè)人提升的職場(chǎng)人士們。

? 2026. All Rights Reserved. 滬ICP備2023009024號(hào)-1