本課題旨在探索機器學習在信用卡欺詐檢測中的基本應用。運用計算機編程和數學模型構建信用卡欺詐的主要特征,并應用機器學習方法自動鑒別涉嫌盜刷的信用卡交易,最終生成實時監測信用卡欺詐的智能程序,力求獲得對實踐有指導意義的結論。
機器學習(Machine Learning, ML)
是人工智能的一個分支。它也是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科,專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。機器學習算法是一類從數據中自動分析獲得規律,并利用規律對未知數據進行預測的算法。因為學習算法中涉及了大量的統計學理論,機器學習與推斷統計學聯系尤為密切,也被稱為統計學習理論。
機器學習已廣泛應用于數據挖掘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰略游戲和機器人等領域。
盜刷信用卡風險已經成為困擾全球銀行信用卡部門的難題之一。僅以美國為例,美聯儲的支付調查報道顯示,2012年全美信用卡支付總金額達到260億美元,這其中未經授權的信用卡支付,也就是盜刷信用卡的金額高達61億美元。衡量信用卡交易的風險涉及一系列復雜的技術,從金融到經濟到法律再到信息科學。傳統的信用卡盜刷檢測需要大量人力參與到分析判斷上,人類審核員會打電話確認這筆交易是否涉嫌信用卡盜刷。現在,由于交易量激增,各大銀行的信用卡部門開始依靠大數據,并通過機器學習和云計算的方法快速甄別涉嫌盜刷的信用卡交易。
AI+X數據驅動型科研
AI+X數據驅動型科研是指使用人工智能(AI)算法,收集、處理、分析具體學科(X)的海量數據,并基于此進行預測,從而獲得科學發現的研究方法。與傳統的、基于實驗或邏輯推理的研究方式相比,AI+X數據驅動型科研可以借助AI算法強大的運算能力,高效地進行大數據分析,具有投入產出比高、適用范圍廣的優點。
AI+X數據驅動型科研已被廣泛地應用于各個領域,利用AI算法研究基因數據,從而進行早期的癌癥篩查便是其中一例。基因組與癌癥病患的數據千千萬萬,使用傳統的科研方式對其進行分析,工程量大、過程繁瑣,在客觀上難以實現。但借助AI算法這一便捷的工具,生命科學家便能夠以海量的患者的遺傳信息為基礎,建立數據庫,與過往的研究成果進行對照,快速、準確地在兩者中發現規律、建立聯系,從而使癌癥診斷的“標準化”成為可能。
整個科研教學流程中,每一位學員都將有學術督導協助保障研究階段性作業和論文的進度,確保取得研究成果。
本課題適合: 9-12 年級學生,有較強的邏輯思維和抽象思維能力
1. 英文: (1)具備基本的學術英語閱讀能力; (2)接觸過英文寫作,有論文寫作經驗者更佳;
2. 數學: (1)概率統計基礎知識 (2)線性回歸 (3)線性代數基礎(行列式、矩陣運算等)
3. 計算機: (1)Python
? 2025. All Rights Reserved. 滬ICP備2023009024號-1