幾個月前我初拾心理統計,看的就是這本傳說中國內最優秀的《現代心理與教育統計學》,看到一半的時候實在看不下去了,轉而看Gravetter教授的《行為科學統計》,短短數日,大徹大悟,醍醐灌頂,豁然開朗,啷哩咯啷,寫下了那篇《標準誤與標準差》()。 想當時初看,腦子裡沒有形成體系,又愚笨而得不到書中真傳,所以只是粗淺地對比評論了此書。而今大徹大悟後再看此書,本指望能看出些好來,優秀教材總歸有優秀之處吧,不想,卻愈發看出了書中的不足,甚至是謬誤。 統計的重點在推論統計,(初級)推論統計的重點則是假設檢驗和方差分析,而推論統計的基礎是機率論。機率論的基礎是什麼?答曰:中心極限定理和大數定律(狹義而言即切比雪夫定理)。假設檢驗和方差分析的核心概念又是什麼?答曰:標準誤和自由度。如果一本統計學的教材,在進入假設檢驗的章節之前,沒有把上述兩個定理和兩個概念講明白,那麼,對於假設檢驗和方差分析的那些公式和步驟多半得生吞活剝死記硬背了。 來看此書。它在引入“標準誤”這個概念時幾近提到了中心極限定理,但沒有指明,反倒是講到〈假設檢驗〉中的“平均數的顯著性檢驗”時,在“總體非正態分佈”的情形裡突然給出了中心極限定理的定義。至於大數定律則壓根沒提,而它在前面“描述統計”部分講標準差時早早提到的“切比雪夫定理”其實是“切比雪夫不等式”。 說到“標準誤”這個概念,我那篇評論中已經指出了,它是在毫無強調的語境中以極短的篇幅給出了標準誤的概念,讓人絲毫體會不到其重要性。至於標準誤的深刻含義和討論,那就更是半句沒有。再說到“自由度”,包括與之密切相關的“無偏估計”,兩個名詞提及了N次,卻從來沒有停下來講講其內涵。在〈機率分佈〉中第一次提及時,它說“自由度是指任何變數中可以自由變化的數目”,準確地說應該是“任何變數中可以自由變化的變數的數目”呀! 如果說作者沒有把上述概念講明白,是由於作者作為專家已經意識不到初學者的障礙何在的話,那下面指出的這個問題不得不讓我心疑作者是否真得理解了標準誤和自由度。自打書中的公式6-11給出後,作者反覆地用這個公式進行偷樑換柱。換出來了什麼呢?(“√”表示“根號下”) 本來,根據定義,t檢驗的標準誤=無偏估計的標準差/√n,同時無偏估計的標準差=√SS/(n-1)。可書中卻往往寫成t檢驗的標準誤=樣本的標準差/√(n-1),這裡樣本的標準差=√SS/n。誠然,這兩種表達方式在數學上是等價的。可問題在於,後一種表示式沒有實質意義,反倒讓人直觀地覺得標準誤和標準差有個莫名其妙的√(n-1)的關係。加之書中本來就沒有詳細討論過它們的關係,也許有人真就會這麼錯誤地理解了。 如果我沒有理由去懷疑作者的權威性的話,那唯一合理的解釋是,作者這麼偷樑換柱是為了便於讀者計算。因為作者對於t檢驗的很多公式都在加減乘除一番之後給出了一個最終的公式,就是那種只要把公式中的各個未知數的值代入就可以得到結果的公式。可作者沒有想到的是,在這麼加減乘除之後得到的那個面目全非的一勞永逸的公式是難以被理解性記憶的,因為從式子上已經看不到什麼邏輯什麼定義了。如果學習統計學到頭來只是為了把這些公式強行灌輸進腦海裡,試問這麼一本教材和用於分析資料的計算機程式何異呢?還是想把學習者的人腦訓練成不要理解只要執行的電腦? 而對於上面已經寫過的SS這個符號,本書到了〈方差分析〉才第一次現身。SS的用處大著呢!記住了它,方差、標準差、假設檢驗和相關回歸通通用得著,還可以和相關裡的SP對比著理解。它不僅讓各種表示式顯得簡潔,從邏輯上易於理解,而且它本身就可以簡化計算。按心理學的話來講,就是引入SS,可以減輕記憶容量,深化記憶的加工水平。何樂而不為呢?本書卻沒有這麼做,包括〈方差分析〉中,如果能夠多引入幾個符號,就不會出現兩個Σ粘在一起,還上標下標括號一大堆的繁忙景象,急死個人兒呀。 這就說到〈方差分析〉中的問題。其一,“完全隨機設計的方差設計”裡分了樣本容量相同、樣本容量不同和利用統計量進行方差分析三種情形,每種情形下分別給出了一套方差分析的公式。實際上,如果作者能夠多花點篇幅講明白方差分析中各個SS和df的定義式的實質含義的話,甭管你是分三種情形,還是三百種情形,一套定義式完全可以通吃!所謂萬變不離其宗嘛。其二,作者在“隨機區組設計的方差分析”中,把重複測量設計作為隨機區組設計的一種(兩個例題也都是重複測量設計),這種處理值得商榷。雖然從統計的角度講,兩種設計的分析確實是一回事,可是從實驗的角度講,這分明是兩種不同的設計。 剩下想說的是,這本書今年出了所謂的修訂版,實際上就是更正了若干筆誤及排版錯誤,還有個別術語的修正。如果這樣就能稱之為修訂版的話,我想說,這修訂版裡剩下的筆誤和排版錯誤還夠出本修訂版呢!若在美國,五年時間夠出兩個貨真價實的修訂版了吧。其實最顯著的變化是,價錢徒增了三元。此外,這書壓根就沒有提到如“效應大小”、“多元方差分析”等內容,如何能稱之為“現代”呢? 在看了一本又一本國內編寫的心理學教材後,我一個最深的感觸就是,好教材難得,教材的整體水平差了國外一大截。如果說教材的差距某種程度上反映了中國與發達國家科研水平的差距的話,這還只是一方面。它反映的應該還有國內學者和國外學者科研水平上的差距,很多教材內容的深度、廣度和新鮮度尤其是作者自己對知識理解的程度,都弗如甚遠。不僅如此,它還可以反映國內學者和國外學者人文素養上的差距,為什麼人家能把知識講得那麼生動活潑讀得簡直欲罷不能而我們卻往往生硬幹癟讀得快要捶胸頓足? 還是向前看吧,希望在前頭,社會在進步,事情正在起變化。早些年那些運動給這個國家造成的創傷不是一代人就恢復得了的。1980年代中後期上大學的知識分子裡,其實已經有些起色了,只是基數太小。再過十年,又會是一幅新氣象。再過二十年,我們這代人應該能夠做出些改變了。 Update:進一步發現了書裡的一處嚴重錯誤:它把“樣本標準差”和“作為總體無偏估計的標準差”當成了兩碼事。這也正好解釋了它為什麼要把t檢驗的公式那麼偷樑換柱,為什麼專門列出個“利用統計量進行方差分析”的一套公式。 是《行為科學統計》上指出樣本標準差即作為總體無偏估計的標準差讓我注意到這個問題。本來還以為只是兩本書理解上的出入,然後我翻了手頭有的多本生物統計學的教材和資料,都是和《行為》一個講法。事實上,SPSS軟體的資料分析以及科研論文中報告的樣本標準差,無一不是作為總體無偏估計的標準差! 這麼大的一個錯誤,卻一版再版。這麼一個錯誤的存在,就意味著此書中假設檢驗的大部分公式都是錯誤的,包括書中很多給出了標準差數值的例題的解也是錯誤的。壓根就沒有也不需要s和s(下標)n-1這麼兩個不同的符號。所謂公式6-11更是無中生有。至於在進行方差齊性檢驗時可以用s近似代替s(下標)n-1就更不對頭了。
幾個月前我初拾心理統計,看的就是這本傳說中國內最優秀的《現代心理與教育統計學》,看到一半的時候實在看不下去了,轉而看Gravetter教授的《行為科學統計》,短短數日,大徹大悟,醍醐灌頂,豁然開朗,啷哩咯啷,寫下了那篇《標準誤與標準差》()。 想當時初看,腦子裡沒有形成體系,又愚笨而得不到書中真傳,所以只是粗淺地對比評論了此書。而今大徹大悟後再看此書,本指望能看出些好來,優秀教材總歸有優秀之處吧,不想,卻愈發看出了書中的不足,甚至是謬誤。 統計的重點在推論統計,(初級)推論統計的重點則是假設檢驗和方差分析,而推論統計的基礎是機率論。機率論的基礎是什麼?答曰:中心極限定理和大數定律(狹義而言即切比雪夫定理)。假設檢驗和方差分析的核心概念又是什麼?答曰:標準誤和自由度。如果一本統計學的教材,在進入假設檢驗的章節之前,沒有把上述兩個定理和兩個概念講明白,那麼,對於假設檢驗和方差分析的那些公式和步驟多半得生吞活剝死記硬背了。 來看此書。它在引入“標準誤”這個概念時幾近提到了中心極限定理,但沒有指明,反倒是講到〈假設檢驗〉中的“平均數的顯著性檢驗”時,在“總體非正態分佈”的情形裡突然給出了中心極限定理的定義。至於大數定律則壓根沒提,而它在前面“描述統計”部分講標準差時早早提到的“切比雪夫定理”其實是“切比雪夫不等式”。 說到“標準誤”這個概念,我那篇評論中已經指出了,它是在毫無強調的語境中以極短的篇幅給出了標準誤的概念,讓人絲毫體會不到其重要性。至於標準誤的深刻含義和討論,那就更是半句沒有。再說到“自由度”,包括與之密切相關的“無偏估計”,兩個名詞提及了N次,卻從來沒有停下來講講其內涵。在〈機率分佈〉中第一次提及時,它說“自由度是指任何變數中可以自由變化的數目”,準確地說應該是“任何變數中可以自由變化的變數的數目”呀! 如果說作者沒有把上述概念講明白,是由於作者作為專家已經意識不到初學者的障礙何在的話,那下面指出的這個問題不得不讓我心疑作者是否真得理解了標準誤和自由度。自打書中的公式6-11給出後,作者反覆地用這個公式進行偷樑換柱。換出來了什麼呢?(“√”表示“根號下”) 本來,根據定義,t檢驗的標準誤=無偏估計的標準差/√n,同時無偏估計的標準差=√SS/(n-1)。可書中卻往往寫成t檢驗的標準誤=樣本的標準差/√(n-1),這裡樣本的標準差=√SS/n。誠然,這兩種表達方式在數學上是等價的。可問題在於,後一種表示式沒有實質意義,反倒讓人直觀地覺得標準誤和標準差有個莫名其妙的√(n-1)的關係。加之書中本來就沒有詳細討論過它們的關係,也許有人真就會這麼錯誤地理解了。 如果我沒有理由去懷疑作者的權威性的話,那唯一合理的解釋是,作者這麼偷樑換柱是為了便於讀者計算。因為作者對於t檢驗的很多公式都在加減乘除一番之後給出了一個最終的公式,就是那種只要把公式中的各個未知數的值代入就可以得到結果的公式。可作者沒有想到的是,在這麼加減乘除之後得到的那個面目全非的一勞永逸的公式是難以被理解性記憶的,因為從式子上已經看不到什麼邏輯什麼定義了。如果學習統計學到頭來只是為了把這些公式強行灌輸進腦海裡,試問這麼一本教材和用於分析資料的計算機程式何異呢?還是想把學習者的人腦訓練成不要理解只要執行的電腦? 而對於上面已經寫過的SS這個符號,本書到了〈方差分析〉才第一次現身。SS的用處大著呢!記住了它,方差、標準差、假設檢驗和相關回歸通通用得著,還可以和相關裡的SP對比著理解。它不僅讓各種表示式顯得簡潔,從邏輯上易於理解,而且它本身就可以簡化計算。按心理學的話來講,就是引入SS,可以減輕記憶容量,深化記憶的加工水平。何樂而不為呢?本書卻沒有這麼做,包括〈方差分析〉中,如果能夠多引入幾個符號,就不會出現兩個Σ粘在一起,還上標下標括號一大堆的繁忙景象,急死個人兒呀。 這就說到〈方差分析〉中的問題。其一,“完全隨機設計的方差設計”裡分了樣本容量相同、樣本容量不同和利用統計量進行方差分析三種情形,每種情形下分別給出了一套方差分析的公式。實際上,如果作者能夠多花點篇幅講明白方差分析中各個SS和df的定義式的實質含義的話,甭管你是分三種情形,還是三百種情形,一套定義式完全可以通吃!所謂萬變不離其宗嘛。其二,作者在“隨機區組設計的方差分析”中,把重複測量設計作為隨機區組設計的一種(兩個例題也都是重複測量設計),這種處理值得商榷。雖然從統計的角度講,兩種設計的分析確實是一回事,可是從實驗的角度講,這分明是兩種不同的設計。 剩下想說的是,這本書今年出了所謂的修訂版,實際上就是更正了若干筆誤及排版錯誤,還有個別術語的修正。如果這樣就能稱之為修訂版的話,我想說,這修訂版裡剩下的筆誤和排版錯誤還夠出本修訂版呢!若在美國,五年時間夠出兩個貨真價實的修訂版了吧。其實最顯著的變化是,價錢徒增了三元。此外,這書壓根就沒有提到如“效應大小”、“多元方差分析”等內容,如何能稱之為“現代”呢? 在看了一本又一本國內編寫的心理學教材後,我一個最深的感觸就是,好教材難得,教材的整體水平差了國外一大截。如果說教材的差距某種程度上反映了中國與發達國家科研水平的差距的話,這還只是一方面。它反映的應該還有國內學者和國外學者科研水平上的差距,很多教材內容的深度、廣度和新鮮度尤其是作者自己對知識理解的程度,都弗如甚遠。不僅如此,它還可以反映國內學者和國外學者人文素養上的差距,為什麼人家能把知識講得那麼生動活潑讀得簡直欲罷不能而我們卻往往生硬幹癟讀得快要捶胸頓足? 還是向前看吧,希望在前頭,社會在進步,事情正在起變化。早些年那些運動給這個國家造成的創傷不是一代人就恢復得了的。1980年代中後期上大學的知識分子裡,其實已經有些起色了,只是基數太小。再過十年,又會是一幅新氣象。再過二十年,我們這代人應該能夠做出些改變了。 Update:進一步發現了書裡的一處嚴重錯誤:它把“樣本標準差”和“作為總體無偏估計的標準差”當成了兩碼事。這也正好解釋了它為什麼要把t檢驗的公式那麼偷樑換柱,為什麼專門列出個“利用統計量進行方差分析”的一套公式。 是《行為科學統計》上指出樣本標準差即作為總體無偏估計的標準差讓我注意到這個問題。本來還以為只是兩本書理解上的出入,然後我翻了手頭有的多本生物統計學的教材和資料,都是和《行為》一個講法。事實上,SPSS軟體的資料分析以及科研論文中報告的樣本標準差,無一不是作為總體無偏估計的標準差! 這麼大的一個錯誤,卻一版再版。這麼一個錯誤的存在,就意味著此書中假設檢驗的大部分公式都是錯誤的,包括書中很多給出了標準差數值的例題的解也是錯誤的。壓根就沒有也不需要s和s(下標)n-1這麼兩個不同的符號。所謂公式6-11更是無中生有。至於在進行方差齊性檢驗時可以用s近似代替s(下標)n-1就更不對頭了。