アルゴリズム (三元配置分散分析)
目次 |
三元配置分散分析の理論
N 個の観測値が3つの因子、Iレベルの因子A、Jレベルの因子B、Kレベルの因子Cと関連しているものとします。
を因子Aのレベルi 、因子Bのレベル j 、因子Cのレベル k でのh 番目の観測値を表すものとすると、三元配置分散分析モデルは下記のようになります。
ここで
は全応答データの平均、
は因子Aのレベルi での偏差、
は因子Bのレベルj での偏差、
は因子Cのレベルk での偏差、
は因子AとB間の相互作用項、
は因子AとC間の相互作用項、
は因子BとC間の相互作用項、
は因子A、B、C間の相互作用項、
は誤差項です。
三元配置の分散分析では、モデルを指定できます。例えば、項
を除外でき(その場合、項
は自律的に除外されます)、モデルは以下のようになります。
指定されたモデルのサンプル偏差は、いわゆる計画行列の手法で生成されます。サンプルとして全てのモデルについて述べると、この手法の処理の要約は、以下の通りです。
全モデルの自由度は
です。全計画行列は
、ここで、
は
の副計画行列で、これは通常全て "1" で構成され、他の副計画行列はそれぞれの添え字が意味するものです。
が関連する0の副計画行列の置換によって表現されるとします。例えば、
定義
二乗誤差の合計は、
全モデルでは、ANOVA表は以下のようにまとめることができます。
| 分散の入力 | 自由度 (DF) | 平方和 (SS) | 平均平方 (MS) | F 値 | Prob > F |
|---|---|---|---|---|---|
| 因子A | I - 1 |
|
|
/
|
|
| 因子B | J - 1 |
|
|
/
|
|
| 因子C | K - 1 |
|
|
/
|
|
| A*B | (I- 1) (J - 1) |
|
|
/
|
|
| A*C | (I- 1) (K - 1) |
|
|
/
|
|
| B*C | (J- 1) (K - 1) |
|
|
/
|
|
| A*B*C | (I- 1) (J - 1)(K - 1) |
|
|
/
|
|
| 誤差 | =N-IJK
|
|
|
||
| 合計 | N - 1 |
|
複数の平均比較
Originでは、平均比較にさまざまな方法があり、これはocstat_dlsm_mean_comparison() 関数を使って行っています。
複数の平均の比較法の2種類がOriginに含まれています。
シングルステップ法これは、Tukey-Kramer, Bonferroni, Dunn-Sidak, Fisher’s LSD, Schefféを含む、平均がどの程度違うのかを示すために信頼区間を作成します。
ステップワイズ法Holm-Bonferroni 、Holm-Sidak 検定を含む仮説検定を実行します。
検出力解析
検出力分析は、サンプルデータに対する仮説の検出力だけでなく、実際の検出力を計算します。
三元配置ANOVAの検出力は、その敏感度の計測です。検出力は、ANOVAが実際の差があるときの標本の平均の差を検出するものです。帰無仮説および対立仮説に関して、検出力は検定する統計量 F が、実際に帰無仮説を棄却すべき(例:与えられた帰無仮説が真でない)ときに、帰無仮説を棄却するのに十分であるという確率です。
Originの三元配置ANOVAダイアログは、因子A、因子Bおよび因子C に対する検出力を計算します。特定の交差項が選択された場合もOriginは検出力を計算します。
検出力は次式で定義されます。
ここで f は、非中心の F-分布の偏りで、このF分布は自由度df および dfe と nc = SS/MSEを持ちます。SS はA, B, C, A*B, A*C, B*C, A*B*Cの二乗和で、MSEは誤差の平均平方、 df は分子の自由度、dfe は誤差の自由度です。全ての値(SS, MSE, df, dfe) は、ANOVA表で取得できます。probf( ) の値が、NAG関数nag_prob_non_central_f_dist (g01gdc)で取得されます。詳細はNAG文書をご覧ください。
上記は、簡単な三元配置ANOVAのアルゴリズムの概要であり、詳細な数学的な演算については、このマニュアルの対応する部分やNAG文書を参照してください。
等分散性のLeveneの検定
Leveneの検定を行うために以下の統計を使用します。
ここで
N は観測値の数、
は観測値
のサブグループの数です。
そして、p値
が得られます。
=N-IJK