回覆列表
  • 1 # maimi32709

    假設檢驗亦稱“顯著性檢驗”,假設檢驗用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。其基本原理是先對總體的特徵作出某種假設,然後透過抽樣研究的統計推理,對此假設應該被拒絕還是接受作出推斷。我就打個形象的比方吧。比如說,你某學期期中考試,總分是500分,然後到了這個學期結束的時候,期末考試,你的成績是512分。如果別人讓你對這兩次考試成績作出判定——期末考試你是否進步了?這就是一個典型的顯著性檢驗的例子。 你試著想想,你能做出這樣的判定嗎? 當然不能直接做出判斷了,因為沒有進行統計檢驗。為什麼要這麼說呢,因為512雖然數字上是大於500分,但是就總是得分數分佈來看,有可能高出的這12分對於總分而言,並不顯著,所謂的“不顯著差異”,實際上最通俗的意思就是:隨機誤差造成的。什麼叫隨機誤差呢,就是說,假如讓你參加100次這樣同等難度的測試卷,你可能成績徘徊在500分上下,有可能高一些有可能低一些,這個波動的區間,就是誤差的區間。所以呢,假設檢驗也就是檢驗兩組資料之間的差異,是否“超越了誤差所限定的區間”。再打個比方。比如說,一個成人“原地跳遠”成績是2米,而國家的統計資料標明,一個成人原地跳遠正常的距離是3米,誤差是 “正負0.5米”,也就是說國家統計的資料是表明一個成年人跳遠距離,正常情況下應該是在2.5~3.5米的這個範圍內。如果在這個誤差允許的範圍內,那麼,“差異就是不顯著的“;但,成績要是遠遠偏離了這個誤差允許的範圍,“那差異就是顯著的”。其實“差異顯著”的意思就是“差異明顯”的意思。 同理,你可以對比一下。國家統計的資料是成年人跳2.5~3.5米是正常的,但是我上面舉得例子,那個人才跳了2米,遠遠的低於誤差的最小值2.5,所以這個人的成績與正常人的平均水平是差異非常顯著的。換句話說,這個比較的根據是什麼呢?也就是說,其實我們是以2.5米~3.5米的平均值3米來衡量的,我們是圍繞著,3這個尺度,然後我們允許這個數有正負0。5的波動,這個0.5就是我們所允許的誤差範圍,超過這個範圍,就差異顯著,不超過就不顯著。100個人測試,95個人的成績都是在2.5~3.5這個區間的,也就是在3正負0.5的範圍波動,這是我們允許的。其他5個人的成績是低於2.5或者是高於3.5,這也是可以允許的,因為這5個人是少數,不能代表整個樣本。你可以照著這個數字推,100個人,95個以上是正常的。那麼1000個人,就是950個人是正常的。10000個人,就是9500個人是正常的。所以我們把差異的分佈,用正態分佈都計算出來了,特別高的,和特別低的,我們都能預測出來,這就是假設檢驗,也稱顯著性檢驗。這是一個最核心的統計學概念,要是不搞懂這個原理,那之後的課程是沒法進行下去的。我給你出個思考題,你如果能把這個道理和正態分佈曲線圖聯絡起來,那這個概念,你也就通了。你試想一下,我們華人的身高是分佈在多少的? 恐怕是白痴也不可能舉出0~100米吧!有人身高0米嗎? 有人身高100米嗎?那我們想一下,普通正常人的身高肯定是1米5到1米8這個區間。這就是一個正態分佈的原理,自然界中大部分事物都是這個原理,所以顯著性檢驗可以基本涵蓋所有的機率事件。我們可以透過計算去得到,差異非常大的,那一部分,比如說,矮與1米5的和高於1米8的人,在現實生活中都不多見,他們占人群的比例非常小,同理而言,你可以推知到上面的幾個例子中。總之,這種抽象的概念,還是得多動腦,不思考是不行的,因為別人怎麼說,也不可能把這種概念給你講清楚,這得靠仔細思考。

  • 中秋節和大豐收的關聯?
  • 5個月的寶寶輔食表是什麼?