Algorithmen (t-Test bei zwei Stichproben)
Inhalt |
Der t-Test bei zwei Stichproben berechnet eine studentisierte t-Statistik und die verbundene Wahrscheinlichkeit, um zu testen, ob die Differenz der zwei Stichprobenmittelwerte gleich \(\mu_d\,\!\) ist (d.h., zum Testen, ob ihre Mittelwerte gleich sind, können Sie testen, ob ihre Differenz 0, \(\mu_1-\mu_2=\mu_d=0\,\!\), ist ). Die Hypothesen haben folgende Form:
\(H_0:\mu_1-\mu_2=\mu_d\,\!\) vs. \(H_1:\mu_1-\mu_2 \ne \mu_d\) Beidseitiger Test
\(H_0:\mu_1-\mu_2 \le \mu_d\) vs. \(H_1:\mu_1-\mu_2 > \mu_d\) Oberer Test
\(H_0:\mu_1-\mu_2 \ge \mu_d\) vs. \(H_1:\mu_1-\mu_2 < \mu_d\) Unterer Test
Teststatistik
Betrachten Sie zwei unabhängige Stichproben, \(x_1\,\!\) und \(x_2\,\!\), des Umfangs \(n_1\,\!\) und \(n_2\,\!\) aus zwei normalverteilten Grundgesamtheiten mit den Mittelwerten \(\mu_1\,\!\) und \(\mu_2\,\!\) und den Varianzen \(\sigma_1^2\,\!\) bzw. \(\sigma_2^2\,\!\), dann haben wir:
\(\bar{x}_1=\frac{1}{n_1}\sum_{j=1}^{n_1}x_{1j}\), \(\bar{x}_2=\frac{1}{n_2}\sum_{j=1}^{n_2}x_{2j}\), \(s_1^2=\frac{1}{n_1-1}\sum_{j=1}^{n_1}{(x_{1j}-\bar{x}_1)^2}\), \(s_2^2=\frac{1}{n_2-1}\sum_{j=1}^{n_2}{(x_{2j}-\bar{x}_2)^2}\)
wobei \(\bar{x}_1\,\!\) und \(\bar{x}_2\,\!\) Stichprobenmittelwerte und \(s_1^2\,\!\) und \(s_2^2\,\!\) Stichprobenvarianzen sind. Danach wird die T-Teststatistik berechnet mit:
Für die gleiche Varianz wird angenommen, das ist \(\sigma_1^2=\sigma_2^2\,\!\):
In diesem Fall hat die Teststatistik t
\[t=\frac{(\bar{x}_1-\bar{x}_2)-\mu_d}{s_p\sqrt{(1/n_1+1/n_2)}}\]
eine t-Verteilung mit \((v = n_1+n_2-2)\) Freiheitsgraden und
\[s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\]
ist die gemeinsame Varianz der zwei Stichproben.
Für die gleiche Varianz wird nicht angenommen:
In diesem Fall hat die herkömmliche t-Statistik bei zwei Stichproben keine t-Verteilung mehr und keine approximative Teststatistik, t'wird verwendet:
\[t'=\frac{(\bar{x}_1-\bar{x}_2)-\mu_d}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\]
Und eine t-Verteilung mit v Freiheitsgraden wird verwendet, um die Verteilung von t' zu approximieren, wobei
\[v=\frac{(s_1^2/n_1+s_2^2/n_2)^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}}\]
Vergleichen Sie den t- Wert mit dem kritischen Wert. Wir weisen \(H_0\,\!\) zurück, wenn:
Für beidseitigen Test: \(|t| > t_{\sigma/2}\,\!\);
Für oberen Test: \(t > t_\sigma\,\!\);
Für unteren Test: \(t < -t_\sigma\,\!\);
Der p-Wert wird auch mit einem benutzerdefinierten Signifikanzniveau \(\sigma\,\!\) verglichen, für das im Allgemeinen 0,05 verwendet wird. Die Nullhypothese \(H_0\,\!\) wird zurückgewiesen, wenn \(p < \mu\,\!\).
Konfidenzintervalle
Die obere und untere \((1-\sigma )\times 100\%\) Konfidenzgrenze für die Mittelwertdifferenz \((\mu_1 - \mu_2)\,\!\) werden berechnet als:
Für die gleiche Varianz wird angenommen:
| Nullhypothese | Konfidenzintervall |
|---|---|
| \[H_0:\mu_1-\mu_2=\mu_d\,\!\] | \[\left[(\bar{x}_1-\bar{x}_2)- t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}, (\bar{x}_1-\bar{x}_2)+ t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right]\] |
| \[H_0:\mu_1-\mu_2 \le \mu_d\] | \[\left[(\bar{x}_1-\bar{x}_2)- t_{\alpha}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}, \infty\right]\] |
| \[H_0:\mu_1-\mu_2 \ge \mu_d\] | \[\left[-\infty, (\bar{x}_1-\bar{x}_2)+ t_{\alpha}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right]\] |
Für die gleiche Varianz wird nicht angenommen:
| Nullhypothese | Konfidenzintervall |
|---|---|
| \[H_0:\mu_1-\mu_2=\mu_d\,\!\] | \[\left[(\bar{x}_1-\bar{x}_2)- t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}, (\bar{x}_1-\bar{x}_2)+ t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\right]\] |
| \[H_0:\mu_1-\mu_2 \le \mu_d\] | \[\left[(\bar{x}_1-\bar{x}_2)- t_{\alpha}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}, \infty\right]\] |
| \[H_0:\mu_1-\mu_2 \ge \mu_d\] | \[\left[-\infty, (\bar{x}_1-\bar{x}_2)+ t_{\alpha}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\right]\] |
wobei \(t_{\sigma/2}\,\!\) der kritische Wert der t-Verteilung mit v Freiheitsgraden ist.
Analyse der Trennschärfe
Die Trennschärfe eines t-Tests bei zwei Stichproben ist ein Maß für seine Fehlererkennbarkeit. Einzelheiten zu dem Algorithmus zum Berechnen der Trennschärfe lesen Sie im Abschnitt Trennschärfe und Stichprobenumfang.
Referenz
Der t-Test bei zwei Stichproben wird mit einer Nag-Funktion implementiert, nag_2_sample_t_test (g07cac). Bitte lesen Sie weitere Einzelheiten zu dem Algorithmus im entsprechenden NAG-Dokument nach.