現在已經進入三月份,距離5月4號的考試還有2個(ge) 月的時間,大家如何保證在複習(xi) 過程中不要跑偏,確定要複習(xi) 哪些重點知識點呢? 這篇文章裏,一丁老師為(wei) 少年和小仙女們(men) ,梳理了在AP統計學考試中基本年年必考的考點,大家在複習(xi) 過程中,一定要重點掌握,弄懂弄通。
Unit 1 Exploring Categorical Variable
1. 明確展示單變量分類變量的圖形有bar chart、pie chart,展示雙變量分類變量的圖形有:side-by-side bar chart和segmental bar chart,容易出選擇題。
2. 掌握單變量分類變量的假設檢驗(chi-square test of goodness of fit)四步驟,選擇題、簡答題都有出題的可能。要熟練掌握計算器的操作,以及利用chi-square cdf來找到pvalue。
3.
4. 掌握雙變量分類變量數據的展示表格—two way table(必考)。
(1)結合概率(probability)考查
例(2010年Form B)
參考答案
(2)掌握通過side by side bar chart,segmental bar chart如何描述變量之間的關(guan) 係(簡答題易考)。 特別注意畫圖一定要基於(yu) 條件概率(conditional probability)的基礎上。 例(2009年Form A)
參考答案
(3)掌握卡方獨立性檢驗(chi squre test of independence)以及卡方比例同質性檢驗(chi-square test for homogeneityof proportions),特別是在碰到簡答題時一定要區分好是哪種檢驗。
Unit 2 Exploring Numerical Variable
1. 對於(yu) 單變量數值型數據(univariate numerical data)
(1) 掌握頻數分布表,累積頻數分布表,看圖時一定看好y軸坐標軸用的是frequency 還是percent等。
(2)掌握展示圖形(4種):點圖(dotplot)、莖葉圖(stem-and-leaf plot)【莖葉圖易考簡答題】注意;莖葉圖的規則是末位數字是leaf,其它部分是stem,要注意在畫圖過程中對數據進行說明,比如73,要寫(xie) 上7|3代表73。 —直方圖(histogram) —boxplot(箱線圖)--每年必考。 特別注意:boxplot無法看出數據個(ge) 數的多少,以及boxplot中線的長度大小不代表數據個(ge) 數的多少,二者沒有對應關(guan) 係。
(3)掌握判斷outlier的標準:
(4)每年必考:describe或者compare distributions(結合4鍾圖形)如果考到簡答題,一定要涉及四方麵:shape、center、spread以及其他usual features(如是否有outlier、gap and cluster) 例(2010年FormB)
參考答案:
2.對於(yu) 雙變量數值型數據(bivariate numerical data) 簡答題中大概率會(hui) 有最小二乘回歸線的題目。
(1)掌握展示圖形—散點圖(scatterplot)並能結合題目的背景信息通過散點圖描述兩(liang) 個(ge) 變量之間的關(guan) 係特征。 主要從(cong) 四方麵展開:形式(form),方向(direction),強度(strength)以及其他unusual features。該考點非常高頻考,需要特別注意:association≠causation。所以在簡答題中出現時千萬(wan) 不要用cause之類的詞,可以用tend to。特別注意結合y=x這條直線。 例(2015年)
參考答案:
(2)掌握相關(guan) 係數(correlation)r的概念,明確-1≤r≤1,明確改變變量計量單位、對變量上的每個(ge) 數字加減常數或乘一個(ge) 大於(yu) 0的常數,r都不變,易考選擇題。
(3)
(4)掌握如何計算殘差(residual)並解釋其含義(yi) 。
(5)
(6)殘差圖(residual plot)以及什麽(me) 樣的殘差圖代表模型擬合好(residuals around 0 and the residual plot shows no pattern),該考點易考。
(7)掌握異常值(outlier),高杠杆點(high-leverage point)以及有影響的點(influential point)。An outlier is a point that does not follow the general trend shown in the rest of data. A high-leverage point has a substantially larger or smaller x-value than the other observations have. An influential point is any point, if removed, changes the relationship substantially(for example:slope /y-intercept/ correlation)
(8)線性回歸模型要掌握如何讀取statistical outputs。
例(2011年Form A)
參考答案:
(9)
例題
答案:E (10)
例(2011年From A)
參考答案:Yes, there is very strong statistical evidence that the population slope differs from zero, so electricity production is linearly related to wind speed. For testing the hypotheses H0:β=0 versus Ha:β≠0, where β represents the population slope, the output reveals that the test statistic is t=12.63 and the p-value(to three decimal places) is 0.000. Because the p-value is so small(much less than both 0.05 and 0.01), the sample data provide very strong statistical evidence that electricity production is linearly related to wind speed.
Unit 3 Data Collection
本章節基本會(hui) 出4-5道選擇題,1道簡答題。
1. Sampling部分
(1)掌握掌握總體(ti) (population)和樣本(sample)的概念,易出選擇題。
(2)掌握隨機抽樣(random sampling)的幾種方法,易考考點,簡答題也會(hui) 出陳述抽樣過程以及比較抽樣方法優(you) 劣的題目。 簡單隨機抽樣(simple random sample):會(hui) 陳述如何抽取簡單隨機樣本,簡答題步驟一定要熟練掌握,考試頻次極高。分層隨機樣本(stratified random sample)整群抽樣(cluster sample)。係統抽樣(systematic random sample) 例(2010年Form b)
參考答案:
(3)掌握抽樣中可能存在的error以及bias。抽樣誤差(sample error):variability due to sampling.偏差(bias):bias occurs when certain response are systematically favored over others. 特別注意僅(jin) 改變sample size n,不會(hui) 對bias產(chan) 生影響,該點易考選擇題。 涵蓋不全偏差(undercoverage bias)、無回答偏差(nonresponse bias)、回答偏差(response bias)、選擇偏差(selection bias)的概念需要了解清楚並掌握,能夠根據題目信息判斷陳述的屬於(yu) 何種偏差。 例該題選 E
2. 實驗(experiment)
(1)掌握觀測研究和實驗的本質區別,觀測研究無法獲得因果關(guan) 係(cause-and-effect)可以通過設計良好的實驗得到因果關(guan) 係。特別是要清楚判斷是觀測研究還是實驗,如果有treatment去treat實驗對象,是實驗。該考點易考。
(2)掌握實驗對象、實驗單位experimental unit,解釋變量explanatory variable(也就是因子factor,因變量(response variable),混淆變量(confounding variable),區組(block,處理(treatment),對照組(control group)以及安慰劑組(placebo group)等的概念,能從(cong) 一段陳述中選出以上概念指的是什麽(me) ,該考點易考。 特別是混淆變量的定義(yi) 一定要明確,既不是自變量,也不是因變量,但是也會(hui) 跟影響因變量。明確在實驗中存在混淆變量的最嚴(yan) 重的後果是variation比較大,控製混淆變量的方式是劃分block,其最主要的目的就是減少variation,該考點易考。 例(2010年Form A)
參考答案:
(3)掌握設計良好的實驗應該滿足的幾個(ge) 要素,以及single blind 和double blind易考。
(4)掌握完全隨機設計(completely randomized design),隨機區組設計(randomized block
Unit 4 Probability,Random Variable and Probability Distribution
1. Probability
(1)掌握基本的概率概念。如果樣本空間內(nei) 的所有可能結果是等可能發生的,那麽(me) 事件
(2) 掌握常見事件及其發生的概率,如補事件(complement)、交集(intersection)、並集(union)、互斥事件(mutually exclusive)、條件概率(conditional probability)以及獨立(independent)的概念及公式,會(hui) 靈活變通及使用這些概率公式。掌握以下公式:
這部分內(nei) 容必考。 特別是將互斥和獨立結合在一起的考點,基本每年必考。
例
參考答案:
(3)明確當題目中給出一個(ge) 一般概率和條件概率時(這是判斷基礎,一定要看好題幹信息),一定在考查tree diagram,高頻考查的考點。
2. 離散型隨機變量及其概率分布(discrete random variable and probability distribution)
(1)
(2)與(yu) 概率結合的考點,必考。 例(2015年)
參考答案:
(3)與(yu) 互斥和獨立結合的考點,基本每年必考。
(4)binomial distribution考點每年必考。要掌握一旦n給定,success p給定時,要有傾(qing) 向的往二項分布考點去判斷。會(hui) 熟練使用計算器binomial pdf和cdf求概率。會(hui) 看公式表找其mean和standard deviation。 例(2011年 Form B)
參考答案:
(5)geometric distribution考點近幾年要關(guan) 注,識別的關(guan) 鍵first success的字樣,掌握geometric pdf和geometric cdf。
3. 獨立隨機變量的組合(combining independent random variables)
該考點必考,特別注意的是在變量之間組合時,樣本標準差成立的前提是隨機變量是獨立的關(guan) 係。 比如:注意不能用1個(ge) 個(ge) 體(ti) 的10倍代表10個(ge) 個(ge) 體(ti) 的和,因為(wei) 世界上沒有完全相同的兩(liang) 個(ge) 個(ge) 體(ti) 。多個(ge) 個(ge) 體(ti) 之間組合一定要用x+y的推廣,不能用ax+by。 例 參考答案:
4. 連續型隨機變量及概率分布(continuous random variable and probability distribution)
(1)掌握z-score的公式及其所代表的含義(yi) 這個(ge) 公式特別重要,每年必考。
(2)掌握zscore解釋。如x value is 1.2 standard deviations above the mean value,意味著x value對應的zscore是1.2;如果將above變為(wei) below,zscore是-1.2,不容易識別,高頻考查。
(3)掌握利用Normal cdf 求概率,以及在給定概率的前提下利用Inverse Normal求取值,每年必考。 例(2014年)
例(2009年Form A)
(4)normal分布與(yu) combine independent variables結合的考點,有難度,每年必考。
Unit 5 Sampling Distribution
1.明確中心極限定理(central limit theorem)的作用The Central limit theorem States that when the sample size is sufficiently large ,a sampling distribution of the mean of a random variable will be approximately normally distributed . 中心極限定理是將樣本均值近似成正態分布的定理,而不是將樣本近似成正態分布,很多同學在這裏有誤區,要區分好。
2.10% condition要掌握,如果樣本量n小於(yu) 等於(yu) 總體(ti) 容量的10%,那麽(me) 可以基本忽略由於(yu) 不放回抽樣所導致的個(ge) 體(ti) 之間可能存在的關(guan) 係,簡答題必考。
3. 樣本均值的抽樣分布--掌握其正態分布的途徑:normal population or large sample(n大於(yu) 等於(yu) 30),並且要會(hui) 進行zscore進而求概率、inverse normal求value;large sample途徑每年必考。 例(2010 From A)
參考答案
4.結合公式表能找到樣本比例、樣本比例差、樣本均值差的抽樣分布對應的mean和standard error,並明確其分別實現normal的途徑,該考點易考。 要特別注意:本部分內(nei) 容一定會(hui) 結合置信區間估計和假設檢驗進行考查。
Unit 6 Parameter Estimation
1.點估計(point estimate) 掌握一個(ge) 好的統計量要同時滿足無偏性(unbiasedness)和有效性(efficiently),明確有效性對應variability of sampling distribution of statistic。 掌握,the best estimator 一定是無偏中波動最小的那一個(ge) 。 例(2008年 from B)
參考答案:
2.明確置信水平(confidence level)的基本概念並能結合題目的具體(ti) 內(nei) 容進行陳述,該考點必考一道選擇題。 例confidence level =95%We can repeatedly take random samples from the population with the same size and construct 95% confidence intervals ,in the long run ,95% of the confidence internals will include the true population parameter value.
3.總體(ti) 均值的置信間區間估計(confidence interval for population mean)
(1)明確當總體(ti) 標準差已知時,采用單樣本z區間對總體(ti) 均值進行置信區間估計。掌握總體(ti) 均值u的置信區間公式:
最高頻的考點為(wei) ,給定margin of error求n,基本每年必考。 例
參考答案:
The smallest sample size is 4979。
(2)明確當總體(ti) 標準差未知時,采用單樣本t區間對總體(ti) 均值進行置信區間估計。總體(ti) 均值的置信區間公式為(wei) :
該考點非常高頻考查,如考簡答題一定要注意嚴(yan) 格按照4步驟進行作答。 例(2013年)
參考答案
4. 總體(ti) 均值差的置信區間估計(confidence interval for the difference of two means)
(1)明確當兩(liang) 個(ge) 總體(ti) 標準差未知且不等時,采用雙樣本t區間對總體(ti) 均值差進行置信區間估計,該考點易出簡答題。 其中,
【注意:無需記憶df公式,先將計算器輸入結果得到直接使用結果中的df即可】 例(2009年From A)
參考答案:
5. 總體(ti) 比例p的置信間區間估計(confidence interval for population proportion)
(1)明確對單一總體(ti) 比例p的置信區間估計采用的是單比例z區間
熟練掌握構建總體(ti) 比例p的置信區間估計的4步驟,能在簡答題中根據題意快速寫(xie) 出步驟作答,本考點易考。
(2)掌握通過邊際誤差的給定值反求樣本量n的題目,該考點也是易考點,基本每年必定會(hui) 有求n的題目考點。 特別注意當p和未知時,代入p=0.5求解。 例(2011年From B)
參考答案
6. 總體(ti) 比例差的置信間區間估計(confidence interval for the difference of two population proportions)
(1)明確總體(ti) 比例差的置信區間估計公式,采用的是雙比例z區間。 (2)熟練掌握構建總體(ti) 比例差的置信區間估計的步驟,能做到根據題意快速寫(xie) 出四步驟作答,該考點易考。 例(2009年From B)
參考答案:
7. 掌握matched pair sample對應的mean difference的求置信區間的4步驟。 考試時一定要區間好題目中是two independent samples 還是matched pair sample(one sample)。
Unit7 Hypothesis Test
1.假設檢驗(hypothesis test)的基本概念 (1)掌握零假設(null hypothesis)以及備擇假設(alternative hypothesis)的概念,能熟練根據題目,快速寫(xie) 出對應的零假設和備擇假設,該考點必考。
(2)掌握檢驗統計量(test statistic)和p值(p-value)的含義(yi) ,該考點必考。
p-value是指在假定零假設為(wei) 真的情況下,可以觀測到的比根據樣本計算出的檢驗統計量值至少更為(wei) 極端的概率。並能夠結合左尾檢驗、右尾檢驗以及雙尾檢驗寫(xie) 出p-value的公式,解釋p-value的含義(yi) 。
2.總體(ti) 均值的假設檢驗(hypothesis test for population mean)當總體(ti) 標準差未知時,采用單樣本t檢驗對總體(ti) 均值進行檢驗,要熟練掌握檢驗4步驟,能根據檢驗結果,做出正確的檢驗結論,該考點高頻考查。 例(2009年from b)
參考答案
3.總體(ti) 均值差的假設檢驗(hypothesis test for the difference of two means)
(1)當兩(liang) 個(ge) 總體(ti) 標準差未知時,要采用雙樣本t檢驗對總體(ti) 均值差進行檢驗,該考點必考。記住:計算器 two sample t test中pooled選No。
(2)熟練掌握進行雙樣本t檢驗的步驟,並能結合題目信息,快速寫(xie) 出步驟進行作答。 例(2010年from A)
參考答案:
4.總體(ti) 比例p的假設檢驗(hypothesis test for population proportion)
(1)明確對單一總體(ti) 比例p的假設檢驗采用的是單比例z檢驗。
(2)明確總體(ti) 比例p的假設檢驗統計量(test statistic)的公式
注意:這裏用的是,該考點高頻考查。
(3)熟練掌握構建總體(ti) 比例p的假設檢驗的4步驟,能做到根據題意快速寫(xie) 出步驟作答。
5.總體(ti) 比例差p1-p2的假設檢驗(hypothesis test for the difference of two population proportions)
(1)明確對兩(liang) 個(ge) 總體(ti) 比例差p1-p2的假設檢驗估計采用的是雙比例z檢驗,能根據題目寫(xie) 出假設。
(2)明確總體(ti) 比例差的假設檢驗統計量(test statistic)的公式:
(3)熟練掌握總體(ti) 比例差p1-p2假設檢驗的4步驟,能夠根據題意快速寫(xie) 出步驟作答。 總體(ti) 比例差p1-p2假設檢驗的考點,非常高頻地被考查。
6. 配對樣本均值差的假設檢驗 掌握matched pair sample對應的mean difference的求假設檢驗的4步驟。 考試時一定要區間好題目中是two independent samples 還是matched pair sample(one sample)。
特別注意:在輸入計算器是,t test中的u0輸入0,該考點高頻考查。 7. 假設檢驗中可能犯的兩(liang) 類錯誤(type I error 以及type Ⅱ error),考點必考 (1)熟練掌握下麵的表格,能夠結合題目信息寫(xie) 出type I error 以及type Ⅱ error。
Type I error是指we reject H0 but actually H0 is true。犯第一類錯誤的概率為(wei) α。
Type Ⅱ error是指we fail to rejectH0 but actually Ha is ture.。犯第二類錯誤的概率為(wei) β。檢驗的勢(power of the test)為(wei) 1-β。
(2)熟練掌握下麵的表格,能夠結合題目信息寫(xie) 出type I error 以及type Ⅱ error。 樣本量n增大;顯著性水平α增大;標準誤差減少;真實的參數值遠離零假設的假定值(真實值在Ha的方向上取值越extreme)。
8. 單尾檢驗和雙尾檢驗的相互轉換,對應的pvalue的不同變化情況,考點高頻考查。
9. 假設檢驗和置信區間的關(guan) 係
(1)明確confidence level+significance level=1
(2)明確如何使用置信區間對雙尾檢驗進行簡單結論的方法:如果零假設的假定值在置信區間外,拒絕零假設; 如果零假設的假定值在置信區間內(nei) ,fail to reject 零假設。 該考點每年必考。 特別注意:置信區間估計隻能跟雙尾檢驗直接聯係,如果想跟單尾檢驗產(chan) 生聯係,單尾檢驗必須先轉成雙尾檢驗。
以上就是老師為(wei) 大家梳理的,複習(xi) 的脈絡和重點。希望大家在複習(xi) 中不要跑偏,分配好各個(ge) AP科目的複習(xi) 時間,做好規劃,順利實現考試拿5分的小目標!
評論已經被關(guan) 閉。