本課題旨在通過數據抓取技術和數據分析方法探求電影評分及其票房之間的關系,并由此出發利用計量經濟學中的時間序列、空間維度、統計回歸等方法探究觀眾對于電影偏好的分歧程度、電影偏好的地域性特征等更具社會意義的問題,力求由此獲得對文化經濟發展更深入的理解。
近年來中國電影行業發展迅速,不斷有叫好又叫座的佳片出現,也存在很多極具爭議性的影片。同時,豆瓣電影評分網和貓眼網等平臺記錄的有關電影的各項數據為深入研究提供機會。 本課題旨在通過數據抓取技術和數據分析方法探求電影評分及其票房之間的關系,并由此出發利用計量經濟學中的時間序列、空間維度、統計回歸等方法探究觀眾對于電影偏好的分歧程度、電影偏好的地域性特征等更具社會意義的問題,力求由此獲得對文化經濟發展更深入的理解。 本課題是跨經濟學和數據抓取的綜合研究,是網絡爬蟲相關技術的實際應用。研究者將獲得使用R進行網絡數據抓取的技能和對電影行業及社會文化經濟發展的深入了解。 科研方法
AI+X數據驅動型科研 AI+X數據驅動型科研是指使用人工智能(AI)算法,收集、處理、分析具體學科(X)的海量數據,并基于此進行預測,從而獲得科學發現的研究方法。與傳統的、基于實驗或邏輯推理的研究方式相比,AI+X數據驅動型科研可以借助AI算法強大的運算能力,高效地進行大數據分析,具有投入產出比高、適用范圍廣的優點。 AI+X數據驅動型科研已被廣泛地應用于各個領域,利用AI算法研究基因數據,從而進行早期的癌癥篩查便是其中一例。基因組與癌癥病患的數據千千萬萬,使用傳統的科研方式對其進行分析,工程量大、過程繁瑣,在客觀上難以實現。但借助AI算法這一便捷的工具,生命科學家便能夠以海量的患者的遺傳信息為基礎,建立數據庫,與過往的研究成果進行對照,快速、準確地在兩者中發現規律、建立聯系,從而使癌癥診斷的“標準化”成為可能。
課題要求
本課題適合: 9-12 年級學生,有較強的邏輯思維和抽象思維能力
1. 英文:
(1)具備基本的學術英語閱讀能力; (2)接觸過英文寫作,有論文寫作經驗者更佳;
2. 數學:
(1)概率統計基礎知識; (2)線性回歸; (3)線性代數基礎(行列式、矩陣運算等)
3. 計算機:
(1)R編程基礎(了解 https://www.r-project.org/about.html) (2)最好項目開始前基本了解,開始后1-2周強化掌握
? 2025. All Rights Reserved. 滬ICP備2023009024號-1