回覆列表
  • 1 # 西北第一美男

    一、概述 在處理資訊時,當兩個變數之間有一定相關關係時,可以解釋為這兩個變數反映此課題的資訊有一定的重疊,例如,高校科研狀況評價中的立項課題數與專案經費、經費支出等之間會存在較高的相關性;學生綜合評價研究中的專業基礎課成績與專業課成績、獲獎學金次數等之間也會存在較高的相關性。而變數之間資訊的高度重疊和高度相關會給統計方法的應用帶來許多障礙。 為了解決這些問題,最簡單和最直接的解決方案是削減變數的個數,但這必然又會導致資訊丟失和資訊不完整等問題的產生。為此,人們希望探索一種更為有效的解決方法,它既能大大減少參與資料建模的變數個數,同時也不會造成資訊的大量丟失。主成分分析正式這樣一種能夠有效降低變數維數,並已得到廣泛應用的分析方法。 主成分分析以最少的資訊丟失為前提,將眾多的原有變數綜合成較少幾個綜合指標,通常綜合指標(主成分)有以下幾個特點: 主成分個數遠遠少於原有變數的個數 原有變數綜合成少數幾個因子之後,因子將可以替代原有變數參與資料建模,這將大大減少分析過程中的計算工作量。 主成分能夠反映原有變數的絕大部分資訊 因子並不是原有變數的簡單取捨,而是原有變數重組後的結果,因此不會造成原有變數資訊的大量丟失,並能夠代表原有變數的絕大部分資訊。 主成分之間應該互不相關 透過主成分分析得出的新的綜合指標(主成分)之間互不相關,因子參與資料建模能夠有效地解決變數資訊重疊、多重共線性等給分析應用帶來的諸多問題。 主成分具有命名解釋性 總之,主成分分析法是研究如何以最少的資訊丟失將眾多原有變數濃縮成少數幾個因子,如何使因子具有一定的命名解釋性的多元統計分析方法。 二、基本原理 主成分分析是數學上對資料降維的一種方法。其基本思想是設法將原來眾多的具有一定相關性的指標X1,X2,…,XP(比如p個指標),重新組合成一組較少個數的互不相關的綜合指標Fm來代替原來指標。那麼綜合指標應該如何去提取,使其既能最大程度的反映原變數Xp所代表的資訊,又能保證新指標之間保持相互無關(資訊不重疊)。 設F1表示原變數的第一個線性組合所形

  • 中秋節和大豐收的關聯?
  • 乙肝懷孕沒做阻斷生下來的寶寶會有乙肝嗎?