本課題目的是培養對大數據的理解和運用,研究如何使其服務與解決商務問題。了解、學習對于大數據的整理,預處理,可視化,分析等數據挖掘(data mining)的各項步驟。最后通過以市場營銷學,宏觀經濟學理論為驅動,最前沿的機器學習為方法來搭建一個可以分類客戶群體、預測客戶購買意向的模型,從而根據結果提出商務建議。
近幾年來互聯網商務的迅速發展使產品銷售的渠道不僅僅局限與傳統實體市場中,但銷售方式的轉換并沒有以同樣的速度來適應這種不斷拓寬的銷售渠道,在為在線購物者提供定制的促銷活動需要更加精確客觀的解決方案和計劃。在當前競爭如此激烈的商務環境下,如何把合適的商品推薦給潛在的消費者或如和維護現有消費者群體是每一個互聯網商家的核心研究問題。獲得,分析,運用在線消費者數據是每個線上產品商家和平臺解決上面問題的必備能力。
目前各大線上商家和平臺已經不斷在學習和開始使用互聯網商務數據。例如,作為北美電商銷售的巨頭亞馬遜會根據消費者商品瀏覽歷史,購買記錄向消費者提供類似相關商品的推薦和折扣信息來鼓勵刺激消費者的購買。
AI+X數據驅動型科研
AI+X數據驅動型科研是指使用人工智能(AI)算法,收集、處理、分析具體學科(X)的海量數據,并基于此進行預測,從而獲得科學發現的研究方法。與傳統的、基于實驗或邏輯推理的研究方式相比,AI+X數據驅動型科研可以借助AI算法強大的運算能力,高效地進行大數據分析,具有投入產出比高、適用范圍廣的優點。
AI+X數據驅動型科研已被廣泛地應用于各個領域,利用AI算法研究基因數據,從而進行早期的癌癥篩查便是其中一例。基因組與癌癥病患的數據千千萬萬,使用傳統的科研方式對其進行分析,工程量大、過程繁瑣,在客觀上難以實現。但借助AI算法這一便捷的工具,生命科學家便能夠以海量的患者的遺傳信息為基礎,建立數據庫,與過往的研究成果進行對照,快速、準確地在兩者中發現規律、建立聯系,從而使癌癥診斷的“標準化”成為可能。
本課題適合: 9-12 年級學生,有較強的邏輯思維和抽象思維能力
1. 英文: (1)具備基本的學術英語閱讀能力; (2)接觸過英文寫作,有論文寫作經驗者更佳;
2. 數學: (1)概率統計; (2)線性回歸; (3)邏輯回歸
3. 計算機: (1)Pandas; (2)Scikit-Learn; (3)Seaborn (基于matplotlib的數據可視化庫)
? 2025. All Rights Reserved. 滬ICP備2023009024號-1