相關係數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變數之間線性相關程度的量,一般用字母 r 表示。
定義
相關關係是一種非確定性的關係,相關係數是研究變數之間線性相關程度的量。由於研究物件的不同,相關係數有如下幾種定義方式。
簡單相關係數:又叫相關係數或線性相關係數,一般用字母r 表示,用來度量兩個變數間的線性關係。
定義式 [1]
其中,Cov(X,Y)為X與Y的協方差,Var[X]為X的方差,Var[Y]為Y的方差
複相關係數:又叫多重相關係數。複相關是指因變數與多個自變數之間的相關關係。例如,某種商品的季節性需求量與其價格水平、職工收入水平等現象之間呈現複相關關係。
典型相關係數:是先對原來各組變數進行主成分分析,得到新的線性關係的綜合指標,再透過綜合指標之間的線性相關係數來研究原各組變數間相關關係。
性質
這裡, , 是一個可以表徵 和 之間線性關係緊密程度的量。它具有兩個性質:
(1)
(2) 的充要條件是,存在常數a,b,使得
由性質衍生:
a. 相關係數定量地刻畫了 X 和 Y的相關程度,即 越大,相關程度越大; 對應相關程度最低;
b. X 和Y 完全相關的含義是在機率為1的意義下存線上性關係,於是 是一個可以表徵X 和Y 之間線性關係緊密程度的量。當 較大時,通常說X 和Y相關程度較好;當 較小時,通常說X 和Y相關程度較差;當X和Y不相關,通常認為X和Y之間不存線上性關係,但並不能排除X和Y之間可能存在其他關係。 [2]
不相關和獨立
若X和Y不相關, ,通常認為X和Y之間不存線上性關係,但並不能排除X和Y之間可能存在其他關係;若 ,則X和Y不相關。
若X和Y獨立,則必有 ,因而X和Y不相關;若X和Y不相關,則僅僅是不存線上性關係,可能存在其他關係,如 ,X和Y不獨立。
因此,“不相關”是一個比“獨立”要弱的概念。 [2]
相關係數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變數之間線性相關程度的量,一般用字母 r 表示。
定義
相關關係是一種非確定性的關係,相關係數是研究變數之間線性相關程度的量。由於研究物件的不同,相關係數有如下幾種定義方式。
簡單相關係數:又叫相關係數或線性相關係數,一般用字母r 表示,用來度量兩個變數間的線性關係。
定義式 [1]
其中,Cov(X,Y)為X與Y的協方差,Var[X]為X的方差,Var[Y]為Y的方差
複相關係數:又叫多重相關係數。複相關是指因變數與多個自變數之間的相關關係。例如,某種商品的季節性需求量與其價格水平、職工收入水平等現象之間呈現複相關關係。
典型相關係數:是先對原來各組變數進行主成分分析,得到新的線性關係的綜合指標,再透過綜合指標之間的線性相關係數來研究原各組變數間相關關係。
性質
這裡, , 是一個可以表徵 和 之間線性關係緊密程度的量。它具有兩個性質:
(1)
(2) 的充要條件是,存在常數a,b,使得
由性質衍生:
a. 相關係數定量地刻畫了 X 和 Y的相關程度,即 越大,相關程度越大; 對應相關程度最低;
b. X 和Y 完全相關的含義是在機率為1的意義下存線上性關係,於是 是一個可以表徵X 和Y 之間線性關係緊密程度的量。當 較大時,通常說X 和Y相關程度較好;當 較小時,通常說X 和Y相關程度較差;當X和Y不相關,通常認為X和Y之間不存線上性關係,但並不能排除X和Y之間可能存在其他關係。 [2]
不相關和獨立
若X和Y不相關, ,通常認為X和Y之間不存線上性關係,但並不能排除X和Y之間可能存在其他關係;若 ,則X和Y不相關。
若X和Y獨立,則必有 ,因而X和Y不相關;若X和Y不相關,則僅僅是不存線上性關係,可能存在其他關係,如 ,X和Y不獨立。
因此,“不相關”是一個比“獨立”要弱的概念。 [2]