箱線圖在文獻中經常見到,是對資料分佈的一種常用表示方法。但是所見資料中往往說的不是特別清楚,因此需要了解一下箱線圖的繪製過程,與部分的意義。計算過程:
1 計算上四分位數,中位數,下四分位數
2 計算上四分位數和下四分位數之間的差值,即四分位數差(IQR,interquartile range)
3 繪製箱線圖的上下範圍,上限為上四分位數,下限為下四分位數。在箱子內部中位數的位置繪製橫線。
4 大於上四分位數1.5倍四分位數差的值,或者小於下四分位數1.5倍四分位數差的值,劃為異常值(outliers)。
5 異常值之外,最靠近上邊緣和下邊緣的兩個值處,畫橫線,作為箱線圖的觸鬚。
6 極端異常值,即超出四分位數差3倍距離的異常值,用實心點表示;較為溫和的異常值,即處於1.5倍-3倍四分位數差之間的異常值,用空心點表示。
7 為箱線圖新增名稱,數軸等。
在SPSS,SigmaPlot, R,SPlus,Origin等軟體中,繪製箱線圖非常方便。
下面是R中的一個箱線圖舉例
箱線圖舉例:
在R軟體中輸入如下命令:
對c向量繪製箱線圖。
箱線圖在文獻中經常見到,是對資料分佈的一種常用表示方法。但是所見資料中往往說的不是特別清楚,因此需要了解一下箱線圖的繪製過程,與部分的意義。計算過程:
1 計算上四分位數,中位數,下四分位數
2 計算上四分位數和下四分位數之間的差值,即四分位數差(IQR,interquartile range)
3 繪製箱線圖的上下範圍,上限為上四分位數,下限為下四分位數。在箱子內部中位數的位置繪製橫線。
4 大於上四分位數1.5倍四分位數差的值,或者小於下四分位數1.5倍四分位數差的值,劃為異常值(outliers)。
5 異常值之外,最靠近上邊緣和下邊緣的兩個值處,畫橫線,作為箱線圖的觸鬚。
6 極端異常值,即超出四分位數差3倍距離的異常值,用實心點表示;較為溫和的異常值,即處於1.5倍-3倍四分位數差之間的異常值,用空心點表示。
7 為箱線圖新增名稱,數軸等。
在SPSS,SigmaPlot, R,SPlus,Origin等軟體中,繪製箱線圖非常方便。
下面是R中的一個箱線圖舉例
箱線圖舉例:
在R軟體中輸入如下命令:
對c向量繪製箱線圖。