凡是和數(shù)據(jù)相關(guān)的專業(yè)和領(lǐng)域,一定是近幾年全球最炙手可熱的。在沒(méi)有基礎(chǔ)和沒(méi)有任何項(xiàng)目經(jīng)驗(yàn)的情況下,如何才能成功升級(jí)打怪呢?參加一段超高含金量的kaggle學(xué)術(shù)活動(dòng)項(xiàng)目一定為你的申請(qǐng)留學(xué)、轉(zhuǎn)專業(yè)、求職和轉(zhuǎn)行加分不少!
今天就帶大家來(lái)看看即刻可以報(bào)名的一場(chǎng)Kaggle學(xué)術(shù)活動(dòng)及賽題解析!
比賽名稱:Novozymes Enzyme Stability Prediction
幫助識(shí)別酶中的熱穩(wěn)定突變
比賽類型:自然語(yǔ)言處理、生物醫(yī)學(xué)
比賽背景酶是在生物體的化學(xué)反應(yīng)中充當(dāng)催化劑的蛋白質(zhì)。本次比賽的目標(biāo)是預(yù)測(cè)酶變體的熱穩(wěn)定性。實(shí)驗(yàn)測(cè)量的熱穩(wěn)定性(熔化溫度)數(shù)據(jù)包括天然序列,以及在天然序列上具有單個(gè)或多個(gè)突變的工程序列。
了解和準(zhǔn)確預(yù)測(cè)蛋白質(zhì)穩(wěn)定性是生物技術(shù)中的一個(gè)基本問(wèn)題。它的應(yīng)用包括酶工程,用于解決世界在可持續(xù)性、碳中和等方面的挑戰(zhàn)。提高酶穩(wěn)定性可以降低成本并提高科學(xué)家迭代概念的速度。語(yǔ)境
許多酶只是勉強(qiáng)穩(wěn)定,這限制了它們?cè)趷毫討?yīng)用條件下的性能。不穩(wěn)定性也會(huì)降低細(xì)胞可產(chǎn)生的蛋白質(zhì)量。因此,開(kāi)發(fā)預(yù)測(cè)蛋白質(zhì)穩(wěn)定性的有效計(jì)算方法具有巨大的技術(shù)和科學(xué)意義。
比賽任務(wù)在本次比賽中,Novozymes 邀請(qǐng)您開(kāi)發(fā)一個(gè)模型,根據(jù)實(shí)驗(yàn)熔解溫度數(shù)據(jù)預(yù)測(cè)/排序酶變體的熱穩(wěn)定性,該數(shù)據(jù)來(lái)自 Novozymes 的高通量篩選實(shí)驗(yàn)室。
如果成功,您將幫助解決提高蛋白質(zhì)穩(wěn)定性的基本問(wèn)題,使設(shè)計(jì)新穎和有用的蛋白質(zhì)(如酶和治療劑)的方法更快、成本更低。
評(píng)價(jià)指標(biāo)提交的內(nèi)容根據(jù)基本事實(shí)與預(yù)測(cè)之間的 Spearman 相關(guān)系數(shù)進(jìn)行評(píng)估。
每個(gè) seq_id 代表一種酶的單突變變體。你的任務(wù)是對(duì)這些變體的穩(wěn)定性進(jìn)行排名,為更穩(wěn)定的變體分配更高的排名。
數(shù)據(jù)描述在本次比賽中,您被要求開(kāi)發(fā)可以預(yù)測(cè)單點(diǎn)氨基酸突變和缺失后蛋白質(zhì)穩(wěn)定性(通過(guò)熔點(diǎn),tm 測(cè)量)排名的模型。
對(duì)于訓(xùn)練集,蛋白質(zhì)穩(wěn)定性(實(shí)驗(yàn)解鏈溫度)數(shù)據(jù)包括自然序列,以及在自然序列上具有單個(gè)或多個(gè)突變的工程序列。數(shù)據(jù)主要來(lái)自不同來(lái)源的已發(fā)表研究。
測(cè)試集包含超過(guò) 2,413 個(gè)酶的單突變變體(GenBank:KOC15878.1)的實(shí)驗(yàn)熔解溫度,由 Novozymes A/S 獲得。
比賽賽程
2022年12月27日:報(bào)名截止日期。您必須在此日期之前接受比賽規(guī)則才能參加比賽。
2022年12月27日:團(tuán)隊(duì)合并截止日期。這是參與者加入或合并團(tuán)隊(duì)的最后一天。
2023年1月3日:最終提交截止日期。
賽題獎(jiǎng)金????
1st?Place?-?$?12,000
2nd Place - $ 8,000
3rd Place - $ 5,000
比賽鏈接:https://www.kaggle.com/competitions/novozymes-enzyme-stability-prediction/
解題思路賽題是一個(gè)典型的醫(yī)學(xué)蛋白質(zhì)預(yù)測(cè)的比賽,任務(wù)可以抽象為回歸任務(wù)。建議可以參考也有學(xué)術(shù)模型。
kaggle含金量
掃碼獲取備賽計(jì)劃,考前查缺補(bǔ)漏、重點(diǎn)沖刺
免費(fèi)領(lǐng)取相關(guān)真題及解析,還有一對(duì)一學(xué)術(shù)活動(dòng)規(guī)劃!

文章大部分內(nèi)容轉(zhuǎn)載自公眾號(hào)【Coggle數(shù)據(jù)科學(xué)】,版權(quán)歸原作者所有,本文僅做分享,如有侵權(quán)請(qǐng)聯(lián)系刪除。

? 2026. All Rights Reserved. 滬ICP備2023009024號(hào)-1