正交試驗設計是獲得最佳搭配的方法之一.它是透過三個步驟完成的:1,利用正交表來安排試驗;2,對試驗的結果進行綜合比較;3,獲得最佳搭配方案.4,分析影響結果的因素的主次。
正交試驗設計表的設計原則是均衡分散搭配,分析試驗結果,其原則為綜合比較,即在同因素中將相同水平的結果相加,找出每個因素中的最好水平,得到最佳搭配。
分析影響結果的因素的主次.將同因素中的兩個水平的結果做差,一般來說差的大小是不同的,差的大小實際上反應了該因素的變化對產量的影響的大小.差大說明該因素水平的變化對試驗的結果影響大,差小說明該因素的變化對試驗結果沒太多影響.因此,可以透過差的大小來確定因素對試驗結果影響的主次,找出影響試驗的主要因素.
在對一個因子試驗所建立的線性模型中,獨立引數(總均值,主效應,互動效應等)的個數k與試驗次數n之間有下面的關係:當nk時,有足夠的自由度k來估計引數,同時還有剩餘自由度來估計誤差的方差(n-k0);當n=k時,有足夠的自由度來估計引數,但是沒有剩餘自由度來估計誤差的方差n-k=0;當nk).在雙因子有重複試驗中,試驗次數大於互動效應模型中獨立引數的總數,因此有剩餘的自由度來估計誤差方差;而在雙因子無重複試驗中,試驗次數等於互動效應模型中獨立引數的總數,因此沒有剩餘自由度來估計誤差方差.此時,要估計誤差就只能用可加效應模型.
根據上述的思路,只要試驗總次數$N$大於獨立引數的個數$M$就可以有足夠的自由度來估計引數,同時還有剩餘的自由度來估計誤差方差,進而作假設檢驗.這是因子試驗設計中要考慮的第一件事.第二件事是要使引數估計和檢驗統計量有好的性質和形式,關鍵是要使各組效應的引數估計之間相互獨立,同時使相應的平方和之間相互獨立.但是,在一個線性模型中,引數(主效應及各種互動效應)的數目是由實際問題本身決定的,而不是由人主觀決定的.在大量的因子試驗的實踐中,人們發現:在很多情況下,因子之間只有主效應,至多存在某些一階互動效應(即兩因子的互動效應).高階互動效應在很多情況下是不存在的.在這種情況下,多因子試驗的模型中包含的引數實際上並不多,可能遠遠少於全模型的引數.比如有6個二水平因子,如果考慮所有可能的互動作用就有26=64個獨立引數(包括總均值),但是如果只考慮主效應則只有6+1=7個獨立引數.因此對6個二水平因子的可加效應模型,理論上只需作8次試驗就可以有多餘的自由度來估計誤差方差.
如何使得上述的兩個想法很好地實現 從雙因子無重複試驗的可加模型的分析中可以得到如何安排試驗的啟示.在這個模型中,由於兩個因子的所有水平組合都作了相同次試驗(一次),因此兩組因子主效應的引數估計不僅有簡單的形式,而且還是相互獨立的,因而平方和之間也是相互獨立的.因此,對於多因子試驗的無互動效應模型(只考慮主效應),如果我們能如此安排試驗,使得對任何一對因子,它們的所有水平組合都作了相同次試驗,則對任何一對因子,兩組因子主效應的引數估計和平方和也應具有上述性質.進而,如果試驗的總次數n超過引數的總個數k,則還有多餘的自由度來估計誤差,進行方差分析.實際上,這就是正交因子設計原理的基本思路.
1) 總均值的估計=試驗資料的總平均值,
2) 某因子的某個主效應的估計=該因子的該主效應所出現的試驗資料的平均值-總平均值,
3) 總平方和=(試驗資料-總平均值)的平方和, 自由度=n-1,
4) 某因子的主效應平方和=重複數×引數估計的平方和, 自由度=水平數-1,
5) 殘差平方和=總平方和-(因子效應平方和的和), 自由度=總平方和-(因子效應自由度的和).
正交試驗設計是獲得最佳搭配的方法之一.它是透過三個步驟完成的:1,利用正交表來安排試驗;2,對試驗的結果進行綜合比較;3,獲得最佳搭配方案.4,分析影響結果的因素的主次。
正交試驗設計表的設計原則是均衡分散搭配,分析試驗結果,其原則為綜合比較,即在同因素中將相同水平的結果相加,找出每個因素中的最好水平,得到最佳搭配。
分析影響結果的因素的主次.將同因素中的兩個水平的結果做差,一般來說差的大小是不同的,差的大小實際上反應了該因素的變化對產量的影響的大小.差大說明該因素水平的變化對試驗的結果影響大,差小說明該因素的變化對試驗結果沒太多影響.因此,可以透過差的大小來確定因素對試驗結果影響的主次,找出影響試驗的主要因素.
在對一個因子試驗所建立的線性模型中,獨立引數(總均值,主效應,互動效應等)的個數k與試驗次數n之間有下面的關係:當nk時,有足夠的自由度k來估計引數,同時還有剩餘自由度來估計誤差的方差(n-k0);當n=k時,有足夠的自由度來估計引數,但是沒有剩餘自由度來估計誤差的方差n-k=0;當nk).在雙因子有重複試驗中,試驗次數大於互動效應模型中獨立引數的總數,因此有剩餘的自由度來估計誤差方差;而在雙因子無重複試驗中,試驗次數等於互動效應模型中獨立引數的總數,因此沒有剩餘自由度來估計誤差方差.此時,要估計誤差就只能用可加效應模型.
根據上述的思路,只要試驗總次數$N$大於獨立引數的個數$M$就可以有足夠的自由度來估計引數,同時還有剩餘的自由度來估計誤差方差,進而作假設檢驗.這是因子試驗設計中要考慮的第一件事.第二件事是要使引數估計和檢驗統計量有好的性質和形式,關鍵是要使各組效應的引數估計之間相互獨立,同時使相應的平方和之間相互獨立.但是,在一個線性模型中,引數(主效應及各種互動效應)的數目是由實際問題本身決定的,而不是由人主觀決定的.在大量的因子試驗的實踐中,人們發現:在很多情況下,因子之間只有主效應,至多存在某些一階互動效應(即兩因子的互動效應).高階互動效應在很多情況下是不存在的.在這種情況下,多因子試驗的模型中包含的引數實際上並不多,可能遠遠少於全模型的引數.比如有6個二水平因子,如果考慮所有可能的互動作用就有26=64個獨立引數(包括總均值),但是如果只考慮主效應則只有6+1=7個獨立引數.因此對6個二水平因子的可加效應模型,理論上只需作8次試驗就可以有多餘的自由度來估計誤差方差.
如何使得上述的兩個想法很好地實現 從雙因子無重複試驗的可加模型的分析中可以得到如何安排試驗的啟示.在這個模型中,由於兩個因子的所有水平組合都作了相同次試驗(一次),因此兩組因子主效應的引數估計不僅有簡單的形式,而且還是相互獨立的,因而平方和之間也是相互獨立的.因此,對於多因子試驗的無互動效應模型(只考慮主效應),如果我們能如此安排試驗,使得對任何一對因子,它們的所有水平組合都作了相同次試驗,則對任何一對因子,兩組因子主效應的引數估計和平方和也應具有上述性質.進而,如果試驗的總次數n超過引數的總個數k,則還有多餘的自由度來估計誤差,進行方差分析.實際上,這就是正交因子設計原理的基本思路.
1) 總均值的估計=試驗資料的總平均值,
2) 某因子的某個主效應的估計=該因子的該主效應所出現的試驗資料的平均值-總平均值,
3) 總平方和=(試驗資料-總平均值)的平方和, 自由度=n-1,
4) 某因子的主效應平方和=重複數×引數估計的平方和, 自由度=水平數-1,
5) 殘差平方和=總平方和-(因子效應平方和的和), 自由度=總平方和-(因子效應自由度的和).