1、研究物件的變化程度通常,總體方差越大,意味著總體內部各事物在調查表現上的差異程度越大,所以需要的樣本容量越大,應該多抽一些樣本單位。也就是說,研究的現象越複雜、差異越大,樣本量要求就越大。
2、研究允許的誤差大小(精確度)一般來說,允許誤差越大,意味著對抽樣的估計精度要求不高,所以就可以少抽取一些樣本單位,需要的樣本容量較小。反之,如果允許誤差很小,就是研究要求精確度較高,那麼需要的樣本量就會比較大。所以,精度要求越高,樣本量越大。
3、要求推斷的置信程度在經驗上,我們會選擇0.05、0.01、0.001這三個水平作為可以接受的犯錯機率。所以,0.05是統計上可以接受的最低標準,也是需要樣本最少的情況,把犯錯機率控制在0.001以下,是非常嚴格的標準,需要的樣本量也越大。同時,這三個犯錯機率分別對應的可靠性係數為0.95、0.99、0.999。也就是說,可靠性係數越大,需要的樣本容量越大。
4、抽樣型別和方法樣本抽取的方法分為隨機抽樣和非隨機抽樣。擴充套件資料樣本容量的相關性質:研究的問題越複雜,差異越大時,樣本量要求越大;要求的精度越高,可推斷性要求越高時,樣本量也越大;同時,總體越大,樣本量也相對要大,但是,增大呈現出一定對數特徵,而不是線形關係;而抽樣方法問題,決定設計效應的值。如果設定簡單隨機抽樣設計效應的值是1;分層抽樣由於抽樣效率高於簡單隨機抽樣,其設計效應的值小於1,合適恰當的分層,將使層內樣本差異變小,層內差異越小,設計效應小於1的幅度越大。多階抽樣由於效率低於簡單隨機抽樣,設計效應的值大於1,所以抽樣調查方法的複雜程度決定其樣本量大小。對於不同城市,如果總體不知道或很大,需要進行推斷時,大城市多抽,小城市少抽,這種說法原則上是不對的。實際上,在大城市抽樣太大是浪費,在小城市抽樣太少沒有推斷價值。
1、研究物件的變化程度通常,總體方差越大,意味著總體內部各事物在調查表現上的差異程度越大,所以需要的樣本容量越大,應該多抽一些樣本單位。也就是說,研究的現象越複雜、差異越大,樣本量要求就越大。
2、研究允許的誤差大小(精確度)一般來說,允許誤差越大,意味著對抽樣的估計精度要求不高,所以就可以少抽取一些樣本單位,需要的樣本容量較小。反之,如果允許誤差很小,就是研究要求精確度較高,那麼需要的樣本量就會比較大。所以,精度要求越高,樣本量越大。
3、要求推斷的置信程度在經驗上,我們會選擇0.05、0.01、0.001這三個水平作為可以接受的犯錯機率。所以,0.05是統計上可以接受的最低標準,也是需要樣本最少的情況,把犯錯機率控制在0.001以下,是非常嚴格的標準,需要的樣本量也越大。同時,這三個犯錯機率分別對應的可靠性係數為0.95、0.99、0.999。也就是說,可靠性係數越大,需要的樣本容量越大。
4、抽樣型別和方法樣本抽取的方法分為隨機抽樣和非隨機抽樣。擴充套件資料樣本容量的相關性質:研究的問題越複雜,差異越大時,樣本量要求越大;要求的精度越高,可推斷性要求越高時,樣本量也越大;同時,總體越大,樣本量也相對要大,但是,增大呈現出一定對數特徵,而不是線形關係;而抽樣方法問題,決定設計效應的值。如果設定簡單隨機抽樣設計效應的值是1;分層抽樣由於抽樣效率高於簡單隨機抽樣,其設計效應的值小於1,合適恰當的分層,將使層內樣本差異變小,層內差異越小,設計效應小於1的幅度越大。多階抽樣由於效率低於簡單隨機抽樣,設計效應的值大於1,所以抽樣調查方法的複雜程度決定其樣本量大小。對於不同城市,如果總體不知道或很大,需要進行推斷時,大城市多抽,小城市少抽,這種說法原則上是不對的。實際上,在大城市抽樣太大是浪費,在小城市抽樣太少沒有推斷價值。