不管用什麼方法,比率資料(二項分佈資料)必須原始樣本量很大,幾百,最好幾千。
如果想做定量分析,一般都是用logistic迴歸。這個網上、書上都有。注意實驗條件非正交的話,要處理共線性。軟體上操作很簡單。
如果條件不是人為控制的,想了解條件之間的相關性(聚類),比如低溫條件是否容易和低光照、少水同時出現,可以採取對應分析。統計軟體上都有。
如果是有控制的正交安排的實驗設計,可以進行析因實驗或響應曲面法(最小二乘)。但由於每個出芽率P的標準差不等且二項分佈非正態,所以需要將P進行變換:
先按國標推薦的方法將P進行修正,即P=(x+0.5)/(n+1)。然後將ln(P/(1-P))作為響應變數進行迴歸,當然也就同時完成了方差分析。這種方法較為成熟。
也可以將arcsin√P作為響應變數進行迴歸。
提醒一下,最好不要浪費樣本資訊。這組樣本不但可以分析出最高出芽率的培養條件,還可以分析出最高健康出芽率(或高等級出芽率)的培養條件。以及兩者綜合最佳的條件。
另外,引數的穩健性也很重要。如果有些因子很重要,但是實際工作中會波動(無法精確控制或無法完全控制),結果實際培育中,每批出芽率波動很大。這個有時也會成為困擾。所以需要找出合適的引數組合,利用互動作用,使得出芽率對於不穩定的培育條件不敏感。
例如,如果某因子處於低水平時,其它因子小幅變化,出芽率相對穩定。而處於高水平時,其它因子小幅變化,出芽率很不穩定。那麼該因子的低水平對於穩定性是有好處的。
穩定性有時會與高比率產生矛盾,但常常能找到緩解矛盾的因子。如果找不到,則分清主次,尋找平衡點。
不管用什麼方法,比率資料(二項分佈資料)必須原始樣本量很大,幾百,最好幾千。
如果想做定量分析,一般都是用logistic迴歸。這個網上、書上都有。注意實驗條件非正交的話,要處理共線性。軟體上操作很簡單。
如果條件不是人為控制的,想了解條件之間的相關性(聚類),比如低溫條件是否容易和低光照、少水同時出現,可以採取對應分析。統計軟體上都有。
如果是有控制的正交安排的實驗設計,可以進行析因實驗或響應曲面法(最小二乘)。但由於每個出芽率P的標準差不等且二項分佈非正態,所以需要將P進行變換:
先按國標推薦的方法將P進行修正,即P=(x+0.5)/(n+1)。然後將ln(P/(1-P))作為響應變數進行迴歸,當然也就同時完成了方差分析。這種方法較為成熟。
也可以將arcsin√P作為響應變數進行迴歸。
提醒一下,最好不要浪費樣本資訊。這組樣本不但可以分析出最高出芽率的培養條件,還可以分析出最高健康出芽率(或高等級出芽率)的培養條件。以及兩者綜合最佳的條件。
另外,引數的穩健性也很重要。如果有些因子很重要,但是實際工作中會波動(無法精確控制或無法完全控制),結果實際培育中,每批出芽率波動很大。這個有時也會成為困擾。所以需要找出合適的引數組合,利用互動作用,使得出芽率對於不穩定的培育條件不敏感。
例如,如果某因子處於低水平時,其它因子小幅變化,出芽率相對穩定。而處於高水平時,其它因子小幅變化,出芽率很不穩定。那麼該因子的低水平對於穩定性是有好處的。
穩定性有時會與高比率產生矛盾,但常常能找到緩解矛盾的因子。如果找不到,則分清主次,尋找平衡點。