回覆列表
-
1 # 使用者981187254678
-
2 # 亦繁星呢
由於均數較易受極端值的影響,因此可以考慮將資料進行行排序後,按照一定比例去掉最兩端的資料,只使用中部的資料來求均數。
如果截尾均數和原均數相差不大,則說明資料不存在極端值,或者兩側極端值的影響正好抵消;反之,則說明資料中有極端值,此時截尾平均數能更好地反映資料的集中趨勢 。
算術平均數的值會受到極端值的影響。在很多情況下,我們需要消除極端值對平均數的影響,例如,在文藝或體育比賽中的評分要去掉若干個最高分和最低分,再計算剩餘資料的平均值,這樣計算得到的就是截尾平均數。
擴充套件資料平均數,也就是算術平均數,指的是所有資料的總和除以總數後所得的商,其代表著某一組資料的整體水平,表徵的是集中量。此外,中位數、眾數等也是常用的集中量。中位數即是將所有資料從小到大或從大到小依次排列後位於中間的那個數(或中間兩個數的平均數)。而眾數則是一組資料中出現次數最多的那個數。
每一類集中量都有其獨特的性質和應用範圍。算術平均數的重要性質之一是各變數與平均數的離差之和等於零,性質之二是各變數對於平均數的離差方之和最小。也就是說,算術平均數是誤差最小的總體表徵值。正是因為算術平均數的嚴謹性,同時在表達上簡單、直觀,更能作進一步的代數運算。因此在所有的集中量中,算數平均數的應用範圍最為廣泛,能有效地反映日常生活中批次資料的整體水平。
但從本質上來說,算術平均數也存在缺點。因其運算需要涉及到整組所有的資料,其中任何資料的變動都會引起平均數的變動,所以平均數極易受到極端值的影響,當出現偏大數時,平均數會較高,當出現偏小數時,平均數會降低。因此,在比賽評分採用算數平均數時,應去掉資料組中的極端數值,即最高值和最低值。
當用平均數來表示一個數據的“集中趨勢”時,如果資料中出現一、兩個極端資料,那麼平均數對於這組資料所起的代表作用就會削弱。為了消除這種現象,將少數極端資料去掉,只計算餘下的資料的平均數,並把所得的結果作為全部資料的平均數。 所以,在評定文藝與體育比賽的成績時,常常採用在評分資料中分別去掉一個(或兩個)最高分和一個(或兩個)最低分,再計算其中平均分的辦法,以避免極端資料造成的不良影響。