一、置信區間、預測區間和容許區間三者比較
當你將引數擬合到模型時,精度或精確度可表示為置信區間、預測區間或容許區間。這三者截然不同。Prism僅報告置信區間。
下面內容解釋了將平均值擬合到資料樣本的簡單情況下的三個不同區間(假設從高斯分佈中抽樣)。相同的想法可應用於由迴歸確定的任何最佳擬合引數的區間。
[1] 置信區間
置信區間,表明了所確定的平均值程度如何。假設資料的確從高斯分佈中隨機抽樣得到。如果你多次這樣做,並計算每個樣本中平均值的置信區間,那麼你會預期95%的置信區間包括群體平均值的真實值。重點:置信區間可以告訴你真實群體引數的可能位置。
[2] 預測區間
基於預測區間,可以預計在何處看到下一個抽樣資料點的位置。假設資料的確從高斯分佈中隨機抽樣得到。收集資料樣本並計算預測區間。然後從群體中再抽取一個值。如果你多次這樣做,你預計下一個值位於95%樣本的預測區間內。重點:預測區間可以告訴你值的分佈,而非確定群體平均值的不確定性。
預測區間必須考慮知道群體平均值的不確定性以及資料離散性。因此預測區間始終比置信區間更寬。
[3] 容許區間
如果你想要95%確定該區間包含95%的值,應該怎麼做?或者90%確定該區間包含99%的值?如需計算或理解容許區間,必須指定兩個不同的百分比。一個表示你想確定的程度,另一個表示區間將包含的值的分數。如果你將第一個值(確定的程度)設定為50%,則容許區間與預測區間相同。如果你將其設定為一個較高值(例如,90%或99%),則容許區間會更寬。
一、置信區間、預測區間和容許區間三者比較
當你將引數擬合到模型時,精度或精確度可表示為置信區間、預測區間或容許區間。這三者截然不同。Prism僅報告置信區間。
下面內容解釋了將平均值擬合到資料樣本的簡單情況下的三個不同區間(假設從高斯分佈中抽樣)。相同的想法可應用於由迴歸確定的任何最佳擬合引數的區間。
[1] 置信區間
置信區間,表明了所確定的平均值程度如何。假設資料的確從高斯分佈中隨機抽樣得到。如果你多次這樣做,並計算每個樣本中平均值的置信區間,那麼你會預期95%的置信區間包括群體平均值的真實值。重點:置信區間可以告訴你真實群體引數的可能位置。
[2] 預測區間
基於預測區間,可以預計在何處看到下一個抽樣資料點的位置。假設資料的確從高斯分佈中隨機抽樣得到。收集資料樣本並計算預測區間。然後從群體中再抽取一個值。如果你多次這樣做,你預計下一個值位於95%樣本的預測區間內。重點:預測區間可以告訴你值的分佈,而非確定群體平均值的不確定性。
預測區間必須考慮知道群體平均值的不確定性以及資料離散性。因此預測區間始終比置信區間更寬。
[3] 容許區間
如果你想要95%確定該區間包含95%的值,應該怎麼做?或者90%確定該區間包含99%的值?如需計算或理解容許區間,必須指定兩個不同的百分比。一個表示你想確定的程度,另一個表示區間將包含的值的分數。如果你將第一個值(確定的程度)設定為50%,則容許區間與預測區間相同。如果你將其設定為一個較高值(例如,90%或99%),則容許區間會更寬。