在AP統計學中,我們把這張圖叫做Scatter plot,圖中的那條線我們叫做Linear regression line。
大家可以非常明顯地看見,這張圖表現出不同的美國大學的Weekday bed time和US news大學排名這兩個變量(Variable)之間的關系。
從圖上看,入睡時間和大學排名之間還是存在比較強的負相關性(negative association)的。也就是說,如果該大學排名越高,可以預計到該校學生的平均入睡時間越晚。
當然,在途中也出現了一個離群值(outlier)。比較明顯的有Air Force Academy和Army/Navy/Coast Guard,這幾個學校的特殊性質決定了它必須是outlier。
當然Columbia University也屬于一個Outlier,也正好說明了想站在頂端,確實要比別人多花好幾倍的努力。
當然,在AP統計學中,單單一個Scatter plot只是表現出了兩個變量之間的association,但并不能說兩者之間就存在Causation,在這里并沒有實際證據證明,大學排名越高就會導致該校學生入睡時間越晚。
再來個另外的例子,一般來說比較發達的城市,汽車保有量比較大,人均壽命也高。相對落后的城市,汽車保有量小,人均壽命也短。在Scatter plot上面,各個城市的汽車保有量和人均壽命這兩個變量(Variable)存在正相關性。
但是我們能說汽車保有量增加會導致人均壽命增加嗎?

? 2025. All Rights Reserved. 滬ICP備2023009024號-1