測試效度 測試效度(test validity)亦稱測試的有效性,指一套測試對應該測試的內容所測的程度.也就是說,一套測試是否達到了它預定的目的以及是否測量了它要測量的內容.例如:“Is photography an art orscience?Discuss.”這種題目以攝影的知識為前提和主要內容,用來考語言能力,就不具有效性.又如用聽寫來測量學生的聽覺能力,其效度也是不理想的,因為書面記錄有聲語言不僅涉及學生的聽覺能力,而且還與他們的書寫速度、拼寫能力、語法知識、記憶能力和對全文的理解能力等有關.
測試效度 測試效度(test validity)亦稱測試的有效性,指一套測試對應該測試的內容所測的程度.也就是說,一套測試是否達到了它預定的目的以及是否測量了它要測量的內容.例如:“Is photography an art orscience?Discuss.”這種題目以攝影的知識為前提和主要內容,用來考語言能力,就不具有效性.又如用聽寫來測量學生的聽覺能力,其效度也是不理想的,因為書面記錄有聲語言不僅涉及學生的聽覺能力,而且還與他們的書寫速度、拼寫能力、語法知識、記憶能力和對全文的理解能力等有關.
測試的效度一般可分為以下幾類:
1)表面效度(face validity).指測試應達到的卷面標準,即一套測試題從表面看來是否是合適的.例如,若一次閱讀理解力的測試包括許多受試者沒有學過的方言詞彙,則可認為這次測試缺乏表面效度.表面效度是測試出受試者正常水平的一種保證因素.
2)內容效度(content validity).指一套測試題是否測試了應該測試的內容或者說所測試的內容是否反映了測試的要求,即測試的代表性和覆蓋面的程度.例如,如果某一套發音技能測試題僅僅考查發音所必須具備的某些技能,如只考單一音素的發音,而不考查重讀、語調或音素在詞語中的發音,那麼,該測試的內容效度就很低.
3)編制效度(construct validity).指一套測試題的諸專案對編制該測試所依據的理論的各個基本方面的反映程度.例如,以結構主義語言理論為基礎,認為系統的語言習慣是透過句型而獲得的,那麼,強調詞彙和語法環境的測試題目就失去了編制效度.
4)經驗效度(empirical validity).經驗效度是一種衡量測試有效性的量度,透過把一次測試與一個或多個標準尺度相對照而得出.經驗效度可分為兩種:一是共時效度(concurrent validity),即將一次測試的結果同另一次時間相近的有效測試的結果相比較,或同教師的鑑定相比較而得出的係數;二是預測效度(predictive validity),即將一次測試的結果同後來的語言能力相比較,或是同教師後來對學生的鑑定相比較而得出的係數.
一般來說,對某次測試的效度進行檢驗時,除了要根據教學大綱的要求和觀念有效性的理論對試卷的內容進行考查以外,還須採用計算相關係數的定量方法,即計算出本次試卷與另一份已被確定能正確反映受試者水平的試卷之間的相關係數.係數高則有效性大.課堂測試的效度應在0.4-0.7之間,規模較大的測試其效度應在0.7以上.