回覆列表
-
1 # fripo7991
-
2 # 使用者3916807372217
相關係數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變數之間線性相關程度的量,一般用字母 r 表示。由於研究物件的不同,相關係數有多種定義方式,較為常用的是皮爾遜相關係數。
相關係數r的絕對值一般在0.8以上,認為A和B有強的相關性。0.3到0.8之間,可以認為有弱的相關性。0.3以下,認為沒有相關性。
擴充套件資料
相關表和相關圖可反映兩個變數之間的相互關係及其相關方向,但無法確切地表明兩個變數之間相關的程度。相關係數是用以反映變數之間相關關係密切程度的統計指標。相關係數是按積差方法計算,同樣以兩變數與各自平均值的離差為基礎,透過兩個離差相乘來反映兩變數之間相關程度;著重研究線性的單相關係數。
需要說明的是,皮爾遜相關係數並不是唯一的相關係數,但是最常見的相關係數,以下解釋都是針對皮爾遜相關係數。
依據相關現象之間的不同特徵,其統計指標的名稱有所不同。如將反映兩變數間線性相關關係的統計指標稱為相關係數(相關係數的平方稱為判定係數);將反映兩變數間曲線相關關係的統計指標稱為非線性相關係數、非線性判定係數;將反映多元線性相關關係的統計指標稱為複相關係數、復判定係數等。
參考資料:
若Y=a+bX,則有:令E(X) = μ,D(X) = σ則E(Y) = bμ + a,D(Y) = bσE(XY) = E(aX + bX) = aμ + b(σ + μ)Cov(X,Y) = E(XY) − E(X)E(Y) = bσ相關係數相關表和相關圖可反映兩個變數之間的相互關係及其相關方向,但無法確切地表明兩個變數之間相關的程度。於是,著名統計學家卡爾·皮爾遜設計了統計指標--相關係數(Correlation coefficient)。相關係數是用以反映變數之間相關關係密切程度的統計指標。相關係數是按積差方法計算,同樣以兩變數與各自平均值的離差為基礎,透過兩個離差相乘來反映兩變數之間相關程度;著重研究線性的單相關係數。依據相關現象之間的不同特徵,其統計指標的名稱有所不同。如將反映兩變數間線性相關關係的統計指標稱為相關係數(相關係數的平方稱為判定係數);將反映兩變數間曲線相關關係的統計指標稱為非線性相關係數、非線性判定係數;將反映多元線性相關關係的統計指標稱為複相關係數、復判定係數等。缺點需要指出的是,相關係數有一個明顯的缺點,即它接近於1的程度與資料組數n相關,這容易給人一種假象。因為,當n較小時,相關係數的波動較大,對有些樣本相關係數的絕對值易接近於1;當n較大時,相關係數的絕對值容易偏小。特別是當n=2時,相關係數的絕對值總為1。因此在樣本容量n較小時,我們僅憑相關係數較大就判定變數x與y之間有密切的線性關係是不妥當的。