Algorithmen (t-Test bei zwei Stichproben)

Inhalt

1 Teststatistik
2 Konfidenzintervalle
3 Trennschärfeanalyse
4 Referenz

Der t-Test bei zwei Stichproben berechnet eine studentisierte t-Statistik und die verbundene Wahrscheinlichkeit, um zu testen, ob die Differenz der zwei Stichprobenmittelwerte gleich \(\mu_d\,\!\) ist (d.h., zum Testen, ob ihre Mittelwerte gleich sind, können Sie testen, ob ihre Differenz 0, \(\mu_1-\mu_2=\mu_d=0\,\!\), ist ). Die Hypothesen haben folgende Form:

\(H_0:\mu_1-\mu_2=\mu_d\,\!\) vs. \(H_1:\mu_1-\mu_2 \ne \mu_d\) Beidseitiger Test

\(H_0:\mu_1-\mu_2 \le \mu_d\) vs. \(H_1:\mu_1-\mu_2 > \mu_d\) Oberer Test

\(H_0:\mu_1-\mu_2 \ge \mu_d\) vs. \(H_1:\mu_1-\mu_2 < \mu_d\) Unterer Test

Teststatistik

Betrachten Sie zwei unabhängige Stichproben, \(x_1\,\!\) und \(x_2\,\!\), des Umfangs \(n_1\,\!\) und \(n_2\,\!\) aus zwei normalverteilten Grundgesamtheiten mit den Mittelwerten \(\mu_1\,\!\) und \(\mu_2\,\!\) und den Varianzen \(\sigma_1^2\,\!\) bzw. \(\sigma_2^2\,\!\), dann haben wir:

\(\bar{x}_1=\frac{1}{n_1}\sum_{j=1}^{n_1}x_{1j}\), \(\bar{x}_2=\frac{1}{n_2}\sum_{j=1}^{n_2}x_{2j}\), \(s_1^2=\frac{1}{n_1-1}\sum_{j=1}^{n_1}{(x_{1j}-\bar{x}_1)^2}\), \(s_2^2=\frac{1}{n_2-1}\sum_{j=1}^{n_2}{(x_{2j}-\bar{x}_2)^2}\)

wobei \(\bar{x}_1\,\!\) und \(\bar{x}_2\,\!\) Stichprobenmittelwerte und \(s_1^2\,\!\) und \(s_2^2\,\!\) Stichprobenvarianzen sind. Danach wird die T-Teststatistik berechnet mit:

Für die gleiche Varianz wird angenommen, das ist \(\sigma_1^2=\sigma_2^2\,\!\):

In diesem Fall hat die Teststatistik t

\[t=\frac{(\bar{x}_1-\bar{x}_2)-\mu_d}{s_p\sqrt{(1/n_1+1/n_2)}}\]

eine t-Verteilung mit \((v = n_1+n_2-2)\) Freiheitsgraden und

\[s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\]

ist die gemeinsame Varianz der zwei Stichproben.

Für die gleiche Varianz wird nicht angenommen:

In diesem Fall hat die herkömmliche t-Statistik bei zwei Stichproben keine t-Verteilung mehr und keine approximative Teststatistik, t'wird verwendet:

\[t'=\frac{(\bar{x}_1-\bar{x}_2)-\mu_d}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\]

Und eine t-Verteilung mit v Freiheitsgraden wird verwendet, um die Verteilung von t' zu approximieren, wobei

\[v=\frac{(s_1^2/n_1+s_2^2/n_2)^2}{\frac{(s_1^2/n_1)^2}{n_1-1}+\frac{(s_2^2/n_2)^2}{n_2-1}}\]

Vergleichen Sie den t- Wert mit dem kritischen Wert. Wir weisen \(H_0\,\!\) zurück, wenn:

Für beidseitigen Test: \(|t| > t_{\sigma/2}\,\!\);

Für oberen Test: \(t > t_\sigma\,\!\);

Für unteren Test: \(t < -t_\sigma\,\!\);

Der p-Wert wird auch mit einem benutzerdefinierten Signifikanzniveau \(\sigma\,\!\) verglichen, für das im Allgemeinen 0,05 verwendet wird. Die Nullhypothese \(H_0\,\!\) wird zurückgewiesen, wenn \(p < \mu\,\!\).

Konfidenzintervalle

Die obere und untere \((1-\sigma )\times 100\%\) Konfidenzgrenze für die Mittelwertdifferenz \((\mu_1 - \mu_2)\,\!\) werden berechnet als:

Für die gleiche Varianz wird angenommen:

Nullhypothese	Konfidenzintervall
\[H_0:\mu_1-\mu_2=\mu_d\,\!\]	\[\left[(\bar{x}_1-\bar{x}_2)- t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}, (\bar{x}_1-\bar{x}_2)+ t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right]\]
\[H_0:\mu_1-\mu_2 \le \mu_d\]	\[\left[(\bar{x}_1-\bar{x}_2)- t_{\alpha}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}, \infty\right]\]
\[H_0:\mu_1-\mu_2 \ge \mu_d\]	\[\left[-\infty, (\bar{x}_1-\bar{x}_2)+ t_{\alpha}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right]\]

Für die gleiche Varianz wird nicht angenommen:

Nullhypothese	Konfidenzintervall
\[H_0:\mu_1-\mu_2=\mu_d\,\!\]	\[\left[(\bar{x}_1-\bar{x}_2)- t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}, (\bar{x}_1-\bar{x}_2)+ t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\right]\]
\[H_0:\mu_1-\mu_2 \le \mu_d\]	\[\left[(\bar{x}_1-\bar{x}_2)- t_{\alpha}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}, \infty\right]\]
\[H_0:\mu_1-\mu_2 \ge \mu_d\]	\[\left[-\infty, (\bar{x}_1-\bar{x}_2)+ t_{\alpha}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\right]\]

wobei \(t_{\sigma/2}\,\!\) der kritische Wert der t-Verteilung mit v Freiheitsgraden ist.

Analyse der Trennschärfe

Die Trennschärfe eines t-Tests bei zwei Stichproben ist ein Maß für seine Fehlererkennbarkeit. Einzelheiten zu dem Algorithmus zum Berechnen der Trennschärfe lesen Sie im Abschnitt Trennschärfe und Stichprobenumfang.

Referenz

Der t-Test bei zwei Stichproben wird mit einer Nag-Funktion implementiert, nag_2_sample_t_test (g07cac). Bitte lesen Sie weitere Einzelheiten zu dem Algorithmus im entsprechenden NAG-Dokument nach.