AP統計可謂是微積分以外最熱門的科目了,因為統計學是很多學科的必備技能,同時也是很實用的一個科目,所以大家要爭取考5分哦,怎么考5分呢?
AP 統計學考試分兩部分:選擇題 (Multiple choice section) 和簡答題 (Free response section),卷面分數100分,選擇題與簡答題各占50分,考試總時間為3小時。在整個統計學的考試中,計算器都是被允許使用的。分值具體換算見下表:
| 題目個數 | 作答時間 | 分數 | |
| 選擇題 | 40 | 90min | 1.25*40=50分 |
| 簡答題 | 6 | 90min | 共50分 |
| Part A | 5 | 每題1.875*4=7.5分,共37.5分 | |
| Part B | 1 | 4*3.125=12.5分 |
2012年-2014年,70分可以兌換5分,2015年100分與5分的對照關系如下表:
| 分數 | 5分制 |
| 64-100 | 5 |
| 51-63 | 4 |
| 37-50 | 3 |
| 27-36 | 2 |
| 0-25 | 1 |
AP統計學的知識點和考點覆蓋了統計學的基礎知識,這些也是統計最核心的基本內容。統計和數據有脫離不開的關系,說的簡單一些,統計就是處理數據的一個工具。
統計學的考試內容也涉及四部分:如何獲取數據(考綱第二部分:抽樣及實驗設計)、數據獲取到之后如何將雜亂無章的數據進行整理并以極其形象的方式展現出來(考綱第一部分:探索性數據分析)、數據體現出的規律性和發生的可能性是怎么樣的(考綱第三部分:概率)、獲取到的歷史數據怎么進行預估和判斷(考綱第四部分:統計推斷)。
College board 將四部分內容在考試中的占比劃分如下:
| 主要內容 | 考試占比 |
| 探索性數據分析 | 20%-30% |
| 抽樣和實驗設計 | 10%-15% |
| 概率和概率分布 | 20%-30% |
| 統計推斷 | 30%-40% |
現在進入考試的攻堅階段,大家一定要練習官方真題,任何的練習題都沒有真題有代表性,至少要將近5年的真題做2遍。市面上現有的巴郎、普林斯頓以及500題,都不建議大家繼續使用,本身題目的出題方向就跟官方題目相差甚遠,為了不出現復習太偏的情況,請大家一定只做真題!
下面對統計學的四部分內容的考點進行簡單的梳理:
一. Exploring Data
探索性數據分析部分包括分類變量的描述分析和數值型變量的描述分析兩部分。
分類變量包含兩部分:單變量分類變量部分要了解頻數分布表(frequency distribution table),條形圖(bar chart)以及餅圖(pie chart);雙變量分類變量部分要掌握列聯表(two-way table)的圖形展示方法即對比條形圖,如何求列聯表中某一個cell對應的expected number
。
單變量數值型變量?(univariate metric variable) 部分要掌握的主要內容包括:
頻數分布表 (frequency distribution table),點圖(dot plot),條形圖(stem plot),直方圖(histogram)。
分布的三種形狀:對稱分布(symmetric distribution)、左偏分布(skew to the left)、右偏分布(skew to the right)
分布中可以體現出的特征:集群和缺口(cluster and gap),異常值(outlier):指與數據中的其他部分有顯著不同的數據點。
衡量分布的中心(center of distribution):均值(mean),中位數(median),眾數(mode),其中中位數和眾數不受outlier的影響。一個mode的數據為unimodal,兩個mode的數據為bimodal。
衡量分布的波動(variation of distribution):極差(range)、標準差(standard deviation)以及四分數差(interquartile range)。其中四分位差不受異常值的影響.
衡量分布的位置(position of distribution):四分位數(quartiles)、百分位數(percentiles)以及標準計分(z-score)。
箱線圖(boxplot),掌握如何繪制箱線圖,并讀取箱線圖的數據。
對隨機變量X進行變換(add or multiple)后,變換后新隨機變量的均值,中位數,標準差,四分位數,極差,四分位差等的變換。
雙變量數值型變量(bivariate metric variable)部分要掌握的主要內容包括:
散點圖(scatterplot),散點圖可以反映出:變量之間是否有關系,正關系還是負關系,關系強弱程度。
相關系數(Correlation)是衡量兩個變量之間相關程度大小的量,取值范圍為[-1,1]。改變變量的計量單位對變量間相關系數的大小沒有影響。
最小二乘回歸線 (least square regression line),,掌握截距項(intercept)和斜率(slope)兩個系數的含義,殘差(residual)的定義,判定系數(Coefficient of determination)的含義,殘差圖(residual plot)及斜率的區間估計和假設檢驗。
二. 抽樣和實驗設計(sampling and experiment)
抽樣和實驗設計部分需要掌握的主要內容包括:
數據獲取的方式主要包括四種:普查、抽樣調查、觀測研究和實驗設計
抽樣方法主要包含兩種:隨機抽樣(random sampling)和有偏抽樣(biased sampling)。隨機抽樣主要包括:簡單隨機抽樣(simple random sampling),分層隨機抽樣(stratified random sampling)、系統抽樣(systematic sampling)以及整群抽樣(cluster sampling)。有偏抽樣主要包括:判斷抽樣(judgmental sampling)、方便抽樣(convenience sampling)以及自愿樣本(volunteer sampling)。
抽樣中可能存在的誤差或偏差。抽樣誤差(Sampling error)是指由于抽樣這一動作所帶來的誤差,所以不可消除,只能通過一定的手段降低。涵蓋不全偏差(undercoverage bias)、無回答偏差(nonresponse bias)以及回答偏差(response bias)等。
實驗設計的基本概念
自變量、因變量
混淆變量(confounding):既不是自變量,又不是因變量,但對因變量有影響的變量。
因子(factor):可以簡單地當做自變量來理解。水平(Level):因子下的取值個數。處理(Treatment):施加給實驗單位的具體處理
控制組(control group),安慰劑(placebo)以及安慰劑組(placebo group)
實驗設計的三要素:隨機化、控制、實驗的可重復性
幾種常見的實驗設計:
完全隨機化設計(completely randomized design)
隨機區組設計(randomized block design)
配對設計(matched pairs design)

? 2025. All Rights Reserved. 滬ICP備2023009024號-1