アルゴリズム (Mann-Whitney検定)

2つの独立した標本\[F(x)\,\]と\[G(y)\,\]について、サンプルサイズが \[n_1\,\!\] および \[n_2\,\! \]であると考えます。サンプルデータはそれぞれ \[x_1,x_2,\ldots ,x_{n_1}\,\!\] および \[y_1,y_2,\ldots ,y_{n_1}\,\!\] と表します。

帰無仮説 :\[H_0: F(x) = G(y)\,\]と表し、2つの分布は同じです。これは対立仮説\[H_1\,\] に対して検定が実行されます。内容としては、

\(H_1: F(x) \neq G(y)\,\);または

\(x\,\)の傾向が\(y\,\)よりも大きくなる場合、\(H_1: F(x) < G(y)\,\!\);または

\(x\,\)の傾向が\(y\,\)よりも小さくなる場合、\(H_1: F(x) > G(y)\,\!\)

検定手順は以下のステップのようになります。

\( x_i \,\!\)と \( y_i\,\!\) を1つのグループに組み合わせます。
それらを昇順で順位付けします。同順位のものは、それらの順位の平均を受け取ります。\(r_{1i}\,\!\)を \( x_i \,\!\)に割り当てられる順位(\( i=1,2,\ldots ,n_1\) において)と、 \( y_i\,\!\)に割り当てられる順位( \( j=1,2,\ldots ,n_2\)において)とします。
順位の合計を計算します。

\( S_1=\sum_{I=1}^{n_1}r_{1i}\,\!\), および \( S_2=\sum_{I=1}^{n_2}r_{2j}\,\!\)です。
検定する統計量 \(U\,\) は次のように表すことができます。

\[ U=S_1-\frac{n_1(n_1+1)}2\,\]
おおよその一般検定統計量 \(z\,\)は次のように計算されます。

\[z=\frac{U-M(U)\pm \frac 12}{\sqrt{Var(U)}} \,\]

ここで

\[M(U)=\frac{n_1n_2}2 \,\]

および

\[Var(U)=\frac{n_1n_2(n_1+n_2+1)}{12}-\frac{n_1n_2}{(n_1+n_2)(n_1+n_2-1)}\times TS \,\]

ここで

\(TS=\sum_{j=1}^\tau \frac{(t_j)(t_j-1)(t_j+1)}{12}\,\).

\( \tau \,\) は、標本内で同順位の数で、\( t_j\,\) は、j 番目のグループの同順位数です。
同順位が存在しない場合、 \(U \,\) の分散は\(\frac{n_1n_2(n_1+n_2+1)}{12}\,\)のようになります。

このアルゴリズムの詳細は、nag_mann_whitney (g08amc)をご覧下さい。