1 Tests bei metrischem Meßniveau
1.1 Chi-Quadrat-Tests
1.1.1
-Anpassungstest
1.1.1.1 Testsituation
- eine einfach Zufallsstichprobe des Umfangs n
- die Untersuchungsvariable ist polytom -> r mögliche Werterealisationen
- es werden für die Werterealisationen die absoluten Häufigkeiten bi i=1...,r, gezählt
1.1.1.2 Testidee
Der-Anpassungstest ist ein rechnerischer Test. Im Gegensatz zum
Kolomogoroff-Smirnov-Test muß die H0 nicht voll spezifiziert sein.
Geprüft wird, ob eine empirische Häufigkeitsverteilung einer theoretisch angenommenen ähnelt, ob sie sich ihr anpaßt:
H0: F(x)=F0(x) Ha: F(x)!=F0(x)
Anders formuliert: Gegeben ist eine Stichprobe aus einer Grundgesamtheit. Man kennt die Verteilungsfunktion der Grundgesamtheit nicht,
testet, ob sie einer theoretischen Verteilung folgt, z.B. der Normalverteilung, Binominalverteilung, Poissonverteilung.
Die Nullhypothese behauptet also, die Grundgesamtheit habe eine bestimmte Verteilung, wobei es sich um stetige wie diskrete
Zufallsverteilungen handeln kann.
Mathematisch werden beim Chiquadrat-Anpassungstest die Abstände zwischen individuellen beobachteten und individuellen theoretischen
Häufigkeiten in die Prüfvariable U transformiert, die (approximativ) eine Chiquadratvariable ist.
1.1.1.3 Die Prüfvariable
Die Prüfvariable ist die Pearsonsche Variable U:
U=
Es geht nicht um signifikanten Abweichungen einzelner Werte, sondern um signifikante Abweichungen der gesamten Verteilungsfunktion. Deshalb
wird über 1 summiert.
Besteht ein großer Abstand zwischen ei und bi, wird die Ho eher abgelehnt.
Bei jedem Chiquadrat-Anpassungstest muß man die Zahl der Freiheitsgrade bestimmen. Die Zahl der Freiheitsgrade hängt von der Zahl
der Klassen und der Anzahl der Parameter, die geschätzt werden müssen ab. Bei r Klassen und zu schätzenden
Parametern beträgt die Zahl der Freiheitsgrade
:
= r-
- 1.
Soll beispielsweise getestet werden, ob eine Nominalverteilung vorliegt, so hat man zwei Parameter, nämlich µ(Mittelwert) und (Streuung), d.h.
= 2. Bei einer Binominalverteilung muß
geschätzt
werden (
= 1), bei einer Poissonverteilung
(
=1).
1.1.1.4 Beispiel (aus Tiede, S.42)
200 Studenten wurden nach dem ihnen am sympathischsten Fach befragt.
Fach | bi | ei | (bi-ei)² | ![]() |
VWL | 45 | 40 | 25 | 0,625 |
BWL | 37 | 40 | 9 | 0,225 |
WiPo | 48 | 40 | 64 | 1,600 |
Finanzwissenschaft | 31 | 40 | 64 | 1,600 |
Statistik | 39 | 40 | 1 | 0,025 |
200 | 200 | 4,5 |
Hypothese: Geprüft werden soll, ob die Studenten alle fünf Fächer gleich sympathisch finden. Das heißt, wenn diese Hypothese
zutrifft, müßten jeweils 1/5 der Studenten die fünf Fächer bevorzugen.
Die Nullhypothese lautet: oder in Worten ausgedrückt:
ist genauso verteilt wie
0i.
Das Signifikanzniveau sei 5 Prozent.
Berechnung des Rückweisungspunktes:
Da keine Parameter geschätzt werden sollen und wir fünf Klassen (=Fächer) haben, ist die Zahl der Freiheitsgrade=5-0-1=4. In der Tabelle
(Formelsammlung S. 30) liest man nach, daß für 4 Freiheitsgrade und fünfprozentigem Signifikanzniveau der Rückweisungspunkt bei
ist.
Nun wird die Pearsonschen Prüfvariable: berechnet (s. Tabelle).
Als Wert ergibt sich u=4,5.
Der Prüfwert u=4,5 ist kleiner als der Rückweisungspunkt von 9,45 d.h. die Nullhypothese wird nicht verworfen, die Studenten finden alle
Fächer gleich sympathisch, die Variable ist in Wahrheit gleichverteilt.
1.1.1.5 Bemerkungen
1. Für den Fall, daß der Stichprobenumfang grenzenlos wächst, folgt U einer Chiquadratverteilung mit v=r-1 Freiheitsgeraden. Die
Prüfgröße U ist nämlich approximativ eine -Variable.
2. Eigentlich gilt der-Anpassungstest nur für n->
, man kann ihn aber auch für kleine Werte von n durchführen. Jede einzelne Klasse der theoretischen Verteilung muß
mindestens mit 5 "theoretischen Beobachtungen" besetzt sein: ei>=5
3. Die Stichprobe sollte nicht zu klein sein, die erwarteten Häufigkeiten nicht unter 1 liegen.
4. Voraussetzung für die Anwendbarkeit des -Anpassungstest (Tiede, S.
42):
Die Modellvoraussetzungen für die Multinominalverteilung müssen gegeben sein:
- bei jedem Einzelzug muß das Stichprobenelement mit der von Zug zu Zug unveränderlichen Wahrscheinlichkeit
1 in die i-te Klasse fallen: Bei großem Auswahlsatz verwendet man das Modell mit Zurücklegen, bei kleinen wäre das nicht nötig. Führt man den Test mit Daten durch, deren Meßniveau über dem nominalen liegt, muß man die Daten gruppieren.
5. Der-Anpassungstest ist auch für den Fall von nur zwei Klassen verwendbar, dann entspricht er einem beidseitigem Binominaltest. Im Fall zweier Klassen entspricht der PEARSONsche Stichprobenumfang nämlich approximativ einer quadrierten Standardnormalvariable, also eine
-Variable mit einem Freiheitsgrad. Beim
-Test vergleicht man k² mit kr², beim zweiseitigen Binominaltest k mit kr.
1.1.2 X2-Homogenitätstest
Der
-Homogenitätstest ist ein Test zur Prüfung der Unterschiede zwischen Anteilswerten aus mehr als zwei unabhängige Stichproben. Die Problemstellung entspricht der Problemstellung der Varianzanalyse.
Testsituation
r unabhängige Stichproben der Umfänge bi
Vorgehensweise
n Objekte kommen in die Auswahl, in jeder Einzelstichprobe werden die s Ausprägungen des interessierenden polytomen Merkmals A ausgezählt. Man beobachtet die absoluten Häufigkeiten bij (bzw. die relativen Häufigkeiten)
Zu prüfen ist die Hypothese: pij weicht nur zufällig von Grundgesamtheitsanteilswertenij ab. Die Homogenitätshypothese dieses Tests behauptet also, daß ein Merkmal in den r Stichproben jeweils zugrundeliegenden Grundgesamtheiten jeweils die gleiche Verteilung hat. Zu prüfen ist also die Hypothese, daß die Stichproben aus einer Grundgesamtheit stammen:
für alle i; j=1...s
Prüfvariable ist wie bei allen Chi-Quadrat-Tests die Pearsonsche Variable U:
Praktisch werden bei diesem Test die beobachteten Häufigkeiten bij mit den aufgrund der Homogenitätshypothese erwarteten Werten eij verglichen. Hierzu wird ein Chi-Quadrat-Test durchgeführt.
Beispiel
An der Ruhr-Uni Bochum wurden StudentInnen befragt, wie sie die Anforderungen ihres Studiums einschätzen. Es ergab sich folgender Befund:Fakultät
Anforderungenzu hoch gerade noch zu bewältigen gut zu bewältigen bzw. gering Summe Philologie 10 (15,1) 58 (62,3) 47 (37,6) 115 Jura 6 (15,8) 69 (65,0) 45 (39,3) 120 Wirtschaftswissenschaft 18 (11,4) 53 (47,1) 16 (28,5) 87 Sozialwissenschaft 3 (7,5) 25 (30,9) 29 (18,6) 57 Maschinenbau 20 (7,2) 30 (29,8) 5 (18,0) 55 Summe 57 235 142 434 Entschieden werden soll, ob sich die Antworten über die Studienanforderungen zwischen den ausgewählten 5 Fakultäten wesentlich unterscheiden. Die Berechnung der erwarteten Häufigkeiten führt zu den eingeklammerten Werten: z.B. für "Philologie" und "gerade noch zu bewältigen" ergibt sich ein Wert von
Für die Prüfvariable u ergibt sich ein Wert von 63,3 (Die Berechnung erfolgt analog zum Chi-Quadrat-Unabhängigkeitstest, S. 5).
Die-Verteilung besitzt v=(r-1)(s-1)=4*2=8 Freiheitsgrade.
Der Rückweisungspunkt liegt für v=8 und ein Signifikanzniveau von 10 Prozent bei 13,4 (Nachschlagen in Chi-Quadrat-Verteilung).
Der Stichprobenbefund u=63,3 liegt rechts vom entsprechenden Rückweisungspunkt=13,4, die Hypothese muß zurückgewiesen werfen.
Ergebnis: Die Nullhypothese muß abgelehnt werden, die Stichproben stammen nicht aus einer GG, die Unterschiede zwischen den Einschätzungen der einzelnen Studiengänge sind signfikant.1.1.3 X2-Unabhängigkeitstest
Testsituation:
- zwei dichotome oder polytome Merkmale X und Y
- eine Stichprobe mit n Objekten, die jeweils eine Ausprägung von X und Y haben
Der-Unabhängigkeitstest prüft die Hypothese, daß die beiden dichotomen/polytomen Merkmale in der Grundgesamtheit voneinander unabhängig sind:
H0:ij=
i.
.j
Das weitere Vorgehen (Berechnung der Prüfvariable etc.) entspricht dem Vorgehen beim-Anpassungstest (S. 4)
Beispiel
vergleiche das Beispiel zum Anpassungstest, S. 4.
Gezogen wird eine Stichprobe, wobei jede Person zwei Merkmale trägt: "Zugehörigkeit zu einer Fakultät" und "Beurteilung der Studienanforderungen".
Geprüft werden soll, ob die These der Unabhängigkeit zwischen "Zugehörigkeit zu einer Fakultät" und "Beurteilung der Studienanforderungen" gestützt werden kann oder ob sie widerlegt werden muß. Der nun analog zu den anderen Chi-Quadrat-Tests durchzuführende Test wird als-Unabhängigkeitstest bezeichnet.
1.2 t-Tests
1.2.1 STUDENTisierung
Die Tatsache, daß die Stichprobenverteilung des arithmetischen Mittels bei normalverteilter Gesamtheit ebenfalls normalverteilt ist, läßt sich bei bekannter Grundgesamtheitsvarianz nutzen. Ist diese jedoch unbekannt, wäre eine entsprechende Schätzung über den Stichprobenbefund bei kleinem Stichprobenumfang zu ungenau. Eine Prüfvariable, die dies berücksichtigt, läßt sich mit Hilfe des StUDENTisierung-Verfahrens gewinnen:
Bei normalverteilter Grundgesamtheit gilt:.
Es läßt sich zeigen, daßwie
verteilt ist (S ist die zur Stichprobenstreuung gehörende Stichprobenvariable). Man kann nun die Definition der Student-t-Variablen einsetzen und erhält die Größe
1.2.2 t-Test bei einer kleinen Stichprobe
Testsituation:
Der Mittelwertdifferenzentest ist ein t-Test bei einem kleinen Stichprobenumfang: n<30.
Voraussetzung ist, daß die Verteilung in der Grundgesamtheit entweder dichotom oder normalverteil ist, sonst sollte man auf andere verteilungsfreie (aber ebenso effiziente) Prüfverfahren ausweichen, z.B. den U-Test.)
Der t-Test testet, ob das arithmetische Mittel der Stichprobe sich signifikant vom arithmetischen Mittel der Grundgesamtheit unterscheidet. Der t-Test nutzt die Information, daß die Stichprobenverteilung des arithmetischen Mittels bei normalverteilter GG ebenfalls normalverteilt ist. Diese Beziehung läßt sich nutzen, wenn die Grundgesamtheitsvarianz ebenfalls 0 ist.
Es ergeben sich folgende Testsituationen:Varianz in der Grund-
gesamtheit
Verteilung der GGbekannt
unbekannt
normalverteilt
nicht
normalverteiltAusweichen auf
verteilungsfreie Verfahren!S ist die zur Stichprobenstreuung gehörende Stichprobenvariable.
Vorgehensweise:- Die Nullhypothese lautet:
- Man bestimmt den Wert der t-Variablen unter der Verwendung von
.
- Dieser Wert wird mit tr (ist abhängig vom SN
und dem Parameter v=n-1) verglichen (Formelsammlung S. 31)
1.2.3 Mittelwertdifferenzentest: t-Test bei zwei unabhängigen kleinen Stichproben
Testidee
Der t-Test für zwei unabhängige kleine Stichproben geht zurück auf das Studentisierungs-Verfahren (s. S.7).
Bei kleinen Stichprobenumfängen lassen sich Aussagen über die Verteilungen der bislang verwendeten Prüfgrößen nur machen, sofern die Grundgesamtheiten normalverteilt sind. Ist dies nicht der Fall, weicht man am besten auf verteilungsfreie Verfahren aus, z.B. den U-Test.
Testsituation- zwei unabhängige kleine Stichproben (n<30)
- Voraussetzung: GG sind normalverteilt, Varianzen der
Gesamtheiten sind gleich (Varianzquotiententest durchführen!)
Beispiel
Es werden zwei Gruppen von 4 bzw. 5 Schülern zufällig ausgewählt, die durch unterschiedliche Unterrichtsmethoden auf die Lösung von handwerklichen Problemen vorbereitet werden. Nach Abschluß des Unterrichts müssen die 9 Schüler jeweils 30 Probleme lösen. Man erhält für die beiden Gruppen folgendes Ergebnis (gelöste Probleme) und möchte wissen, ob die Differenz zwischen den beiden Grupenmitteln bei 5% Signifikanzniveau (einseitig) nur aus zufälligen Gründen aufgetreten ist.
Gruppe 1 13 15 17 18 Gruppe 2 14 16 18 22 23 1. Die Nullhypothese lautet:
1=
2
2. Man berechnet die arithmetischen Mittel:
3. ... und die Varianzenund
(für den t-Test ist Voraussetzung, daß die GG normalverteilt sind und die Varianzen der Gesamtheiten gleich sind
- zwei dichotome oder polytome Merkmale X und Y
- ggf mit Varianzquotiententest prüfen!)
4. Jetzt wird die Prüfgröße t1r berechnet:
: Differenz der arithmetischen Mittel
: ?, Differenz der arithm. Mittel in der Grundgesamtheit (?), kann aufgrund der Homogenitätshypothese mit 0 angenommen werden
=
=Varianz der Stichprobe 1,
5. Für v=n1+n1-2=7 Freiheitsgerade ergibt sich bei einem SN von 5% einseitig (also bei 10% nachschauen, Tabelle Formelsammlung S.31) ein Rückweisungspunkt von 1,81.
6. Die Prüfgröße liegt links vom Rückweisungspunkt (1,39<1,89), d.h. die Nullhypothese kann bestehen bleiben. Die Differenz zwischen den beiden Gruppenmitteln ist zufällig.1.2.4 Mittelwertdifferenzentest: t-Test bei zwei verbundenen Stichproben
Der t-Test für zwei verbundene Stichproben läßt sich als Problem des t-Test-Ein-Stichproben-Falls (S.7) auffassen. Ausgegangen wird von der Differenz der D=X1-X2. Aus den Paaren der Stichprobenvariablen (Xi1,X2i) und berechnet daraus den Durchschnitt:
(weiteres siehe Formelsammlung)