アルゴリズム (クロス集計)
目次 |
クロス集計は、分割表とも呼ばれます。この機能は、変数間の関連の存在や強さを確かめるために使用されます。
クロス集計の手法
- 度数カウント
- 周辺とセル
- カイ二乗検定表
- フィッシャーの正確確率検定 (2 x 2のみ)
- 関連性の尺度
- 一致性の尺度
- オッズ比と相対危険度 (2 x 2のみ)
- Cochran-Mantel-Haenszel
度数カウント
定義
は昇順の行変数の明確な値で、たとえば、/math-afa34668ee4178285b425ccef9790f80.png)
は昇順の列変数の明確な値で、たとえば、/math-443ff437c68afb202ac14bf0d0046751.png)
はセル
についての度数
は
番目の行の小計
は
番目の列の小計
は総計
周辺とセル
| 統計 | 式および説明 |
|---|---|
| 度数 | ![]() |
| 期待度数 | ![]() |
| 行パーセント | ![]() |
| 列パーセント | ![]() |
| 合計パーセント | ![]() |
| 残差 | ![]() |
| 標準化残差 | ![]() |
| 調整済み残差 | ![]() |
カイ二乗統計
| 統計 | 式および説明 | 自由度 |
|---|---|---|
| ピアソンのカイ二乗 | ![]() |
![]() |
| 尤度比 | ![]() |
![]() |
| 線形関連 | , ここで はピアソンの相関係数 |
![]() |
| 連続補正 | , これは 2 x 2 表でのみ計算 |
![]() |
フィッシャーの正確確率検定
この検定は、期待セル度数が低い(5よりも低い)とき便利です。2 x 2 表でのみ計算されます。次のような表を考えます。
![]() |
![]() |
小計/合計 | |
|---|---|---|---|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
| 小計/合計 | ![]() |
![]() |
![]() |
帰無仮説(独立)下で、最初のセル
の度数は、以下で与えられる確率の超幾何分布です。
,
.
片側検定
片側検定の有意水準は以下で計算されます。
- p(左片側検定) =
/math-86e6e38543be7730a5d275879331853b.png)
- p(右片側検定) =
/math-a0da9ea8cfd87134a3bc676fc188f06e.png)
両側
両側の有意性は
/math-26774c9dfcd5e97bc46f921e5d961bc3.png)
ここで
の場合 /math-81db1a1a7d204cda8eca78cd1626e9d0.png)
の場合 /math-e793456f33b630b6743c3e2532b86d9e.png)
関連性の尺度
定義
/math-e1447424a87a72997354115e74f780d2.png)
/math-9a63691fc5e41c8da93b03ae0e8fc436.png)
/math-0bf9a641a2a2f9570c4874c60e4ff055.png)
/math-abe49e571496aef0ee9284532118e575.png)
/math-ae03d6a4fc3d6bde417a7352ed6c0d76.png)
/math-1306db1d8aedf83c64c23134dc6f6cce.png)
は
番目の行の小計
は
番目の列の小計
は総計
| 統計 | 式および説明 | 標準誤差 | |
|---|---|---|---|
| Phi 係数 | , これは 2 x 2 表でないとき計算。2 x 2 表の場合 に等しい。
|
||
| クラメールのV | ![]() |
||
| C係数 | ![]() |
||
| ガンマ | ![]() |
![]() |
|
| ケンドール | タウb | ![]() |
![]() |
| タウc | , ここで ![]() |
![]() |
|
| SomersのD | C R |
![]() |
![]() |
R C |
![]() |
![]() |
|
| 対称 | ![]() |
![]() |
|
| ラムダ | C R |
, ここで はi番目の行で最も大きな度数、 は最も大きな列小計 |
,ここで |
R C |
,
ここで |
,ここで |
|
| 対称 | ![]() |
![]() ここで |
|
| 不確実性 | C R |
, ここで , および , および ![]() |
, ここで ![]() |
R C |
![]() |
![]() |
|
| 対称 | ![]() |
![]() |
|
一致性の尺度
この表は(1)
であるような正方形の表かつ、(2)行変数と列変数が同じ値を持つときに計算されます。
カッパ統計は次式で計算されます。
昇順誤差は以下で推定されます。
.
ここで
,
,
および /math-b3d3228022c4151930cd2512e69756bf.png)
帰無仮説
下の対応する漸近的標準誤差は以下で与えられます。
他の関連する統計はBowkerで、これは全ての対の検定
に使用されます。
の場合以下のように計算されます。
大きなサンプルでは、
は自由度
の漸近的なカイ二乗分布です。
2 x 2 表ではBowker'の検定はMcNemarの検定に等しくなります。そのためBowkerの検定のみ提供します。
オッズ比と相対危険度
これらは、2 x 2 表でのみ計算されます。
オッズ比
オッズ比は以下のように計算されます。
/math-3fa39a72468c2793e5b60fc04aa0aef1.png)
相対危険度
相対危険度は以下のように与えられます。
Cochran-Mantel-Haenszel
定義
はレイヤの数
はi番目の行、j番目の列、k番目のレイヤの行の頻度
はj番目の列、k番目のレイヤ小計
はi番目の行、k番目のレイヤの小計
はk番目のレイヤ小計
はi番目の行、j番目の列、k番目のセルの行の推定された頻度/math-5f5f9e9f589b49daa28976461688df13.png)
Mantel-Haenszel 統計
Mantel-Haenszel統計は次式で計算されます。
/math-a19d6f25b272775d916bf03f49c392a7.png)
sgn は符号関数
です。
Breslow-Day 統計
Breslow-Day 統計は、
![BD = \sum_{k=1}^{K} V_k \left[f_{11k}-\hat{f}_{11k}\right]^2 BD = \sum_{k=1}^{K} V_k \left[f_{11k}-\hat{f}_{11k}\right]^2](/origin-help/ja/images/Algorithm(CrossTabs)/math-9e373b8a5825fcf21df5156eec3131d9.png)
ここで
です。
タローンの統計
タローンの統計は、
ここで
です。
共通オッズ比
2×2×K 表の場合、k番目のレイヤのオッズ比は
です。共通オッズ比が存在すると仮定、つまり
とすると、共通オッズ比のMantel-Haenszelの推定子は、
の漸近的分散は、
の下側信頼限界(LCL)と上側信頼限界(UCL)は、
および ![ln(\hat OR_{MH})+z(alpha/2)\sqrt{\hat Var[ln(\hat OR_{MH})]} ln(\hat OR_{MH})+z(alpha/2)\sqrt{\hat Var[ln(\hat OR_{MH})]}](/origin-help/ja/images/Algorithm(CrossTabs)/math-e8dcfecb9336a5c778bcff6588b5c278.png)
/math-f30a2b0e3370f0814c959957a224dd89.png)
/math-19639d8682c50097fbde98f448d6a16a.png)
/math-589eb80e404ec249dc486616aaf78822.png)
/math-3357da1c1efa26e265b977d3b0670c1c.png)
/math-56959063ec3204d0aeeae97829b457f3.png)
/math-c48259c9651c2f6503d9960937e6533e.png)
/math-c0843832a859ffc34d11d9099f6428b0.png)
/math-16abb82ca7492ebc6d92c48f3cb57156.png)
/math-457e064382dbfc17fa5acc98b7037504.png)
/math-5711c9b4ed36c6b98d89fb52d062fc0a.png)
, ここで
はピアソンの相関係数/math-c4ca4238a0b923820dcc509a6f75849b.png)
, これは 2 x 2 表でのみ計算/math-0d5fa3f335333b23d4aaf795d1336587.png)
/math-e209e24a3d42a840c21481572570342f.png)
/math-c772000136f6d3ba6dec3c7c5a35458b.png)
/math-6c773b2b7798e5713845e475d0c4b4c7.png)
/math-5967eff521c650a997f82f083abf639a.png)
/math-6657a6c206f3e5e31275783a3668e5de.png)
/math-b5825a6794db70d759fd6fa7eb747fd7.png)
/math-e501ae2ad90dc374410a774da21c5739.png)
/math-43c5783d36b015e36edeecd60da73206.png)
/math-4d19d3c0c698ba1ab821a9d391ae4fac.png)
/math-f16c4024084f71bae29d858ad345502b.png)
/math-7f53026eedc310e75b8bfbaafcc98e9d.png)
/math-8d9c307cb7f3c4a32822a51922d1ceaa.png)
/math-fb4549dbe0388469b28f1e469e8dbccc.png)
, これは 2 x 2 表でないとき計算。2 x 2 表の場合
からの値の範囲, ここで /math-557fee2c06855d00673e05c0d165d00e.png)
/math-32808fbdf779579250ced07a3b57f092.png)
/math-0512a20370c1a32d02c46e82c38d5767.png)
/math-ca54853c333dece226fd892c1471fca6.png)
/math-ceeab2bf0dfc9669dc3af396bdf3b9f0.png)
/math-d483a07e25f428eae9e524345b1f6097.png)
![2\sqrt{\frac{1}{D_rD_c}\left[\sum_{ij}f_{ij}(C_{ij}-D_{ij})^2-\frac{1}{N}(P-Q)^2\right]} 2\sqrt{\frac{1}{D_rD_c}\left[\sum_{ij}f_{ij}(C_{ij}-D_{ij})^2-\frac{1}{N}(P-Q)^2\right]}](/origin-help/ja/images/Algorithm(CrossTabs)/math-e06a2ae207bc0f4367248d2f7795410b.png)
, ここで /math-0d910548fc627e702b2e9d398eeed3bc.png)
/math-423d45130bb7e6a7741ed999591467b1.png)
R/math-a55cc67126812452ebb989878123e1d1.png)
/math-e1b49506418c36946f11b0273a1ff255.png)
/math-95c75be2de7e1e529a221f1b6ff2c0ae.png)
/math-08de37f7d4b6824a6f734bab201f8682.png)
/math-7b2342cd106f701a2394591454e27dc3.png)
/math-13b710204e1ae878fb90eee4ce577ed8.png)
, ここで
はi番目の行で最も大きな度数、
は最も大きな列小計
,
は
は
,
はj番目の列で最も大きな度数、
は最も大きな行小計
,
は
は /math-e1eba21c82a1b082d636a63187cb00a7.png)
/math-19a542d5e209aac0810776eadb8cedef.png)
,
,
, および /math-9864388d59406b2ca9fc4b3b8b495d0c.png)
, ここで
, および
, および /math-ea444840a2b4f491836ac96f310228fc.png)
, ここで /math-bed50ae560cb148d344cf16dcd5a0108.png)
/math-2f741623b6366e540eaba9c97d083e7b.png)
/math-eed562bf2445e78c73aa3c344fb75249.png)
/math-1b42c23d992439355e27425484c6fe29.png)
/math-16431aabee7e70358843ece1fbd3d1c7.png)
/math-5254a7c3d0d060337a3cbbbdf6875b25.png)
![SE_0 = \sqrt{\frac{1}{N\left(N^2 - \sum_{i=1}^{R}r_ic_i\right)^2} \left[N^2\sum_{i=1}^{R}r_ic_i + \left(\sum_{i=1}^{R}r_ic_i\right)^2 - N \sum_{i=1}^{R}r_ic_i(r_i+c_i)\right]} SE_0 = \sqrt{\frac{1}{N\left(N^2 - \sum_{i=1}^{R}r_ic_i\right)^2} \left[N^2\sum_{i=1}^{R}r_ic_i + \left(\sum_{i=1}^{R}r_ic_i\right)^2 - N \sum_{i=1}^{R}r_ic_i(r_i+c_i)\right]}](/origin-help/ja/images/Algorithm(CrossTabs)/math-2fb11a39b32089a9fb7b374c23a68abc.png)
/math-d430e26fecf56fc1e12fb1c885b0977d.png)
/math-ddef868fb9aede240998288fda3c3aa7.png)
/math-d2ceb3919433fdc636aaa24dbf97eff3.png)
/math-beb356acfebcc913c83cc436c4c1a294.png)
/math-dccda1547a25ca3e806a9ca71e7f18b8.png)
![T = \sum_{k=1}^{K} V_k \left[f_{11k}-\hat{f}_{11k}\right]^2- \frac{\sum_{k=1}^{K}\left[f_{11k}-\hat{f}_{11k}\right]^2}{\sum_{k=1}^{K}\frac {1}{V_k} } T = \sum_{k=1}^{K} V_k \left[f_{11k}-\hat{f}_{11k}\right]^2- \frac{\sum_{k=1}^{K}\left[f_{11k}-\hat{f}_{11k}\right]^2}{\sum_{k=1}^{K}\frac {1}{V_k} }](/origin-help/ja/images/Algorithm(CrossTabs)/math-2d5715c073380230f9458c06eed9823c.png)
/math-488db329f6cab4e8b965215f34861f44.png)
![\hat Var[ln(\hat OR_{MH})]=\frac{\sum_{k=1}^{K}\frac{(f_{11k}+f_{22k})f_{11k} f_{22k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{11k} f_{22k}}{n_{k}}}+\frac{\sum_{k=1}^{K}\frac{(f_{11k}+f_{22k})f_{12k} f_{21k}+(f_{12k}+f_{21k})f_{11k} f_{22k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{11k} f_{22k}}{n_{k}}\sum_{k=1}^{K}\frac{f_{12k} f_{21k}}{n_{k}}}+\frac{\sum_{k=1}^{K}\frac{(f_{12k}+f_{21k})f_{12k} f_{21k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{12k} f_{21k}}{n_{k}}} \hat Var[ln(\hat OR_{MH})]=\frac{\sum_{k=1}^{K}\frac{(f_{11k}+f_{22k})f_{11k} f_{22k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{11k} f_{22k}}{n_{k}}}+\frac{\sum_{k=1}^{K}\frac{(f_{11k}+f_{22k})f_{12k} f_{21k}+(f_{12k}+f_{21k})f_{11k} f_{22k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{11k} f_{22k}}{n_{k}}\sum_{k=1}^{K}\frac{f_{12k} f_{21k}}{n_{k}}}+\frac{\sum_{k=1}^{K}\frac{(f_{12k}+f_{21k})f_{12k} f_{21k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{12k} f_{21k}}{n_{k}}}](/origin-help/ja/images/Algorithm(CrossTabs)/math-fe6d99fcba77f28d2e62c52d30d014f4.png)