Home » 國際競賽 » Details

Kaggle競賽知識點：排序賽中概率加權方法

Category: 國際競賽 Date: 2022年7月27日下午3:28

在Kaggle學術活動中直接將多個模型的預測結果進行加權是一種常見的操作，這種操作可以增加模型的精度，也可以增加結果的穩定性。但對不同的任務，其實加權方法存在一定的區別。對于分類、回歸、排序，對結果進行集成也存在區別。

分類任務：直接投票；

回歸任務：加權求和；

排序任務：排序加權；

本次我們將討論二分類任務中的集成細節，如果比賽提交的是概率，使用AUC進評分的方式。

#?真實標簽

t_true?=?np.random.randint(0,?2,?size=1000)

#?模型1

pred1?=?t_true?+?np.random.randn(1000)

pred1?=?np.clip(pred1,?0,?1)

#?模型2

pred2?=?t_true?+?np.random.randn(1000)?-?0.2

pred2?=?np.clip(pred2,?0,?1)

#?模型3

pred3?=?t_true?+?np.random.randn(1000)?-?0.1

pred3?=?np.clip(pred3,?0,?1)

此時三個模型的AUC精度分別為：

0.7295611075760666

0.7629832839094122

0.7522801035701279

方法1：加權平均此種方式非常直接，可以直接平均也可以調整權重。

權重的確定方式有如下幾種：人工確定，通過精度反饋調整；從精度確定權重（精度高權重高）；通過1層的stacking確定權重；

方法2：幾何平均幾何平均可對形態進行轉換，對概率進行校準。權重確定的方式參考上面加權平均的方法。

方法3：排序平均通過rankdata函數可以求得概率的次序，將次序從新進行歸一化轉為0-1范圍。

from?scipy.stats?import?rankdata

rankdata([1,3,2])

#?array([1.,?3.,?2.])

排序平均的方法如下：

效果對比加權平均AUC：0.8650706942160006

集合平均AUC：0.8575510547104799

排序平均AUC：0.8664093421215869

排序平均的結果優于直接加權，通過重新對次序進行歸一化的效果，可以避免模型概率輸出分布不一致的情況。

掃碼獲取備賽計劃，考前查缺補漏、重點沖刺

【免費領取】相關真題及解析，還有一對一學術活動規劃！

以上就是關于【Kaggle競賽知識點：排序賽中概率加權方法】的解答，如需了解學校/賽事/課程動態，可至翰林教育官網獲取更多信息。

往期文章閱讀推薦：

2026五大奧賽中國隊斬獲四個世界第一，全員金牌收官！

【組隊招募】經濟/數模競賽CNEC/IEO/SIC/HiMCM…組隊報名！

Tags: kaggle

Previous post: 2022紐約時報夏季讀寫比賽報名開啟，比賽獲獎率如何？ Next post: 8月即將截止的5大國際寫作競賽：劍橋主辦，三大頂級期刊鼎立支持！

Kaggle競賽知識點：排序賽中概率加權方法

翰林AMC8視頻課重磅上線！

國際競賽真題資源免費領取

最新發布

學員訪談丨UCB/CMU/萊斯三所頂尖院校offer！上中國際學霸如何將學術優勢發揮極致？

新加坡學子通往ISEF的專屬通道！2027新加坡科學與工程博覽會（SSEF）關鍵時間點公布！

名額預警！2026-2027賽季康萊德稀缺王牌課題席位緊張，STEM/商科生速來！

加州大學2026Fall官方錄取數據！UCB反超UCLA成最難分校，國際生錄取兩極分化！

翰林人文社科國際競賽全面開花！斬獲多項大獎！實力見證！

15人入圍IEO國家（集訓）隊，斬獲CNEC全球冠軍！翰林經濟商科戰績大匯總！

生物競賽金牌教練的實戰書單！生物學/生物化學/病理學...電子版免費領！

重磅！9.9元USACO美國信息學奧賽體驗課！新賽季翰林助力高效沖獎！

熱門標簽

快捷功能

導航

聯系我們