回覆列表
  • 1 # 使用者3916807372217

    一般是指多元迴歸中將年度變數和行業變數加入迴歸。

    多元迴歸分析的X變數一般分為兩種:解釋變數和控制變數,解釋變數往往是論文中作者希望關注的變數,而控制變數則是也可以影響Y變數、X變數,但是並不是作者需要研究的變數,但是為了研究的嚴謹必須也考慮。

    打個比方,假設我的Y變數是看“工資”,我的研究希望探究“性別變數”怎樣影響“工資”,可是這裡就有兩個問題:第一,工資是隨著時間變化的,過去的工資因為經濟發展比較低而現在的工資高,男女加入工作的比例也是隨著時間變化的,現在女性工作的更多;第二,工資是根據行業不同的,而男女的行業分佈也往往不同。因此,如果不控制“年份”和“行業”兩個變數,許多結論就無從下。例如我不控制行業和年份,得出了“工資女性較低,女性被歧視”的結論,有人可能就會反駁——女性在的行業往往是注重安穩而工資較低的,女性偏好安穩,因此並不是工資上有女性歧視,而是行業不同而已。所以為了真的發現女性是否被歧視,我就需要控制行業。比如看教師行業男性女性工資是否有統計差距?金融業?……

    那麼怎麼控制行業呢?如果只有一個行業還好,可是行業很多,我們一個一個更改資料庫做單變量回歸是很沒有效率的,這時我們就用到了多元迴歸的一個特性,每一個係數的含義是說:“控制其他加入多元迴歸的解釋變數不變,這個解釋變數變動1單位,則Y變動係數個單位”,因此我們就直接將行業變數(對行業變數的處理往往是考慮N個行業就加入N個不同變數,它們都是0、1的虛擬變數,0是指在這個行業裡,1是指不在)和年份變數(直接加入時間變數)加入多元迴歸就可以得出“控制行業和年份”下的性別對工資的影響係數了。這樣,我再分析出來就不會受到質疑。

    實現這種迴歸,大部分統計軟體都可以,包括SPSS,在寫公式的時候按照我上述的方法在迴歸中新增入這些變數就可以了。

  • 中秋節和大豐收的關聯?
  • 那首歌的歌詞有前塵寫下的一筆一劃這一句話?