凡是和數據相關的專業和領域,一定是近幾年全球最炙手可熱的。在沒有基礎和沒有任何項目經驗的情況下,如何才能成功升級打怪呢?參加一段超高含金量的kaggle學術活動項目一定為你的申請留學、轉專業、求職和轉行加分不少!
今天就帶大家來看看即刻可以報名的一場Kaggle學術活動及賽題解析!
比賽名稱:Novozymes Enzyme Stability Prediction
幫助識別酶中的熱穩定突變
比賽類型:自然語言處理、生物醫學
比賽背景酶是在生物體的化學反應中充當催化劑的蛋白質。本次比賽的目標是預測酶變體的熱穩定性。實驗測量的熱穩定性(熔化溫度)數據包括天然序列,以及在天然序列上具有單個或多個突變的工程序列。
了解和準確預測蛋白質穩定性是生物技術中的一個基本問題。它的應用包括酶工程,用于解決世界在可持續性、碳中和等方面的挑戰。提高酶穩定性可以降低成本并提高科學家迭代概念的速度。語境
許多酶只是勉強穩定,這限制了它們在惡劣應用條件下的性能。不穩定性也會降低細胞可產生的蛋白質量。因此,開發預測蛋白質穩定性的有效計算方法具有巨大的技術和科學意義。
比賽任務在本次比賽中,Novozymes 邀請您開發一個模型,根據實驗熔解溫度數據預測/排序酶變體的熱穩定性,該數據來自 Novozymes 的高通量篩選實驗室。
如果成功,您將幫助解決提高蛋白質穩定性的基本問題,使設計新穎和有用的蛋白質(如酶和治療劑)的方法更快、成本更低。
評價指標提交的內容根據基本事實與預測之間的 Spearman 相關系數進行評估。
每個 seq_id 代表一種酶的單突變變體。你的任務是對這些變體的穩定性進行排名,為更穩定的變體分配更高的排名。
數據描述在本次比賽中,您被要求開發可以預測單點氨基酸突變和缺失后蛋白質穩定性(通過熔點,tm 測量)排名的模型。
對于訓練集,蛋白質穩定性(實驗解鏈溫度)數據包括自然序列,以及在自然序列上具有單個或多個突變的工程序列。數據主要來自不同來源的已發表研究。
測試集包含超過 2,413 個酶的單突變變體(GenBank:KOC15878.1)的實驗熔解溫度,由 Novozymes A/S 獲得。
比賽賽程
2022年12月27日:報名截止日期。您必須在此日期之前接受比賽規則才能參加比賽。
2022年12月27日:團隊合并截止日期。這是參與者加入或合并團隊的最后一天。
2023年1月3日:最終提交截止日期。
賽題獎金????
1st?Place?-?$?12,000
2nd Place - $ 8,000
3rd Place - $ 5,000
比賽鏈接:https://www.kaggle.com/competitions/novozymes-enzyme-stability-prediction/
解題思路賽題是一個典型的醫學蛋白質預測的比賽,任務可以抽象為回歸任務。建議可以參考也有學術模型。
kaggle含金量
掃碼獲取備賽計劃,考前查缺補漏、重點沖刺
免費領取相關真題及解析,還有一對一學術活動規劃!

文章大部分內容轉載自公眾號【Coggle數據科學】,版權歸原作者所有,本文僅做分享,如有侵權請聯系刪除。

? 2025. All Rights Reserved. 滬ICP備2023009024號-1