Der
-Anpassungstest
ist ein rechnerischer Test. Im Gegensatz zum Kolomogoroff-Smirnov-Test
muß die H0 nicht voll spezifiziert sein.
Geprüft wird, ob eine empirische Häufigkeitsverteilung einer
theoretisch angenommenen ähnelt, ob sie sich ihr anpaßt:
H0: F(x)=F0(x) Ha:
F(x)!=F0(x)
Anders formuliert: Gegeben ist eine Stichprobe aus einer Grundgesamtheit. Man
kennt die Verteilungsfunktion der Grundgesamtheit nicht, testet, ob sie einer
theoretischen Verteilung folgt, z.B. der Normalverteilung, Binominalverteilung,
Poissonverteilung.
Die Nullhypothese behauptet also, die Grundgesamtheit habe eine bestimmte
Verteilung, wobei es sich um stetige wie diskrete Zufallsverteilungen handeln
kann.
Mathematisch werden beim Chiquadrat-Anpassungstest die Abstände zwischen
individuellen beobachteten und individuellen theoretischen Häufigkeiten in
die Prüfvariable U transformiert, die (approximativ) eine
Chiquadratvariable ist.
Die
Prüfvariable ist die Pearsonsche Variable U:
U=

Es geht nicht um signifikanten Abweichungen einzelner Werte, sondern um
signifikante Abweichungen der gesamten Verteilungsfunktion. Deshalb wird
über 1 summiert.
Besteht ein großer Abstand zwischen ei und bi, wird
die Ho eher abgelehnt.
Bei jedem Chiquadrat-Anpassungstest muß man die Zahl der
Freiheitsgrade bestimmen. Die Zahl der Freiheitsgrade hängt von der
Zahl der Klassen und der Anzahl der Parameter, die geschätzt werden
müssen ab. Bei r Klassen und
zu schätzenden Parametern
beträgt die Zahl der Freiheitsgrade
:
= r-
- 1.
Soll beispielsweise getestet werden, ob eine Nominalverteilung vorliegt, so hat
man zwei Parameter, nämlich µ(Mittelwert) und
(Streuung),
d.h.
= 2. Bei einer Binominalverteilung muß
geschätzt
werden (
= 1), bei einer Poissonverteilung
(
=1).
200
Studenten wurden nach dem ihnen am sympathischsten Fach befragt.
| Fach | bi | ei | (bi-ei)² | |
| VWL | 45 | 40 | 25 | 0,625 |
| BWL | 37 | 40 | 9 | 0,225 |
| WiPo | 48 | 40 | 64 | 1,600 |
| Finanzwissenschaft | 31 | 40 | 64 | 1,600 |
| Statistik | 39 | 40 | 1 | 0,025 |
| 200 | 200 | 4,5 |
Hypothese:
Geprüft werden soll, ob die Studenten alle fünf Fächer
gleich sympathisch finden. Das heißt, wenn diese Hypothese zutrifft,
müßten jeweils 1/5 der Studenten die fünf Fächer
bevorzugen.
Die Nullhypothese lautet:
oder
in Worten ausgedrückt:
ist genauso verteilt wie
0i.
Das Signifikanzniveau sei 5 Prozent.
Berechnung des Rückweisungspunktes:

Da keine Parameter geschätzt werden sollen und wir fünf Klassen
(=Fächer) haben, ist die Zahl der Freiheitsgrade=5-0-1=4. In der Tabelle
(Formelsammlung S. 30) liest man nach, daß für 4 Freiheitsgrade und
fünfprozentigem Signifikanzniveau der Rückweisungspunkt bei
ist.
Nun wird die Pearsonschen Prüfvariable:
berechnet (s. Tabelle).
Als Wert ergibt sich u=4,5.
Der Prüfwert u=4,5 ist kleiner als der Rückweisungspunkt von 9,45
d.h. die Nullhypothese wird nicht verworfen, die Studenten finden alle
Fächer gleich sympathisch, die Variable ist in Wahrheit gleichverteilt.
1.
Für den Fall, daß der Stichprobenumfang grenzenlos wächst,
folgt U einer Chiquadratverteilung mit v=r-1 Freiheitsgeraden. Die
Prüfgröße U ist nämlich approximativ eine
-Variable.
2. Eigentlich gilt der
-Anpassungstest
nur für n->
, man kann ihn aber auch für kleine Werte von
n durchführen. Jede einzelne Klasse der theoretischen Verteilung muß
mindestens mit 5 "theoretischen Beobachtungen" besetzt sein:
ei>=5
3. Die Stichprobe sollte nicht zu klein sein, die erwarteten Häufigkeiten
nicht unter 1 liegen.
4. Voraussetzung für die Anwendbarkeit des
-Anpassungstest
(Tiede, S. 42):
Die Modellvoraussetzungen für die
Multinominalverteilung müssen gegeben sein:
1 in die i-te Klasse
fallen: Bei großem Auswahlsatz verwendet man das Modell mit
Zurücklegen, bei kleinen wäre das nicht nötig. Führt man
den Test mit Daten durch, deren Meßniveau über dem nominalen liegt,
muß man die Daten gruppieren.Der
-Homogenitätstest ist ein Test zur Prüfung der
Unterschiede zwischen Anteilswerten aus mehr als zwei unabhängige
Stichproben. Die Problemstellung entspricht der Problemstellung der
Varianzanalyse.
Testsituation
r unabhängige Stichproben der Umfänge bi
Vorgehensweise
n Objekte kommen in die Auswahl, in jeder Einzelstichprobe werden die
s Ausprägungen des interessierenden polytomen Merkmals A
ausgezählt. Man beobachtet die absoluten Häufigkeiten bij
(bzw. die relativen Häufigkeiten
)
Zu prüfen ist die Hypothese: pij weicht nur zufällig von
Grundgesamtheitsanteilswerten
ij ab. Die
Homogenitätshypothese dieses Tests behauptet also, daß ein Merkmal
in den r Stichproben jeweils zugrundeliegenden Grundgesamtheiten jeweils
die gleiche Verteilung hat. Zu prüfen ist also die Hypothese, daß
die Stichproben aus einer Grundgesamtheit stammen:
für alle i; j=1...s
Prüfvariable ist wie bei allen Chi-Quadrat-Tests die Pearsonsche Variable
U:

Praktisch werden bei diesem Test die beobachteten Häufigkeiten
bij mit den aufgrund der Homogenitätshypothese erwarteten
Werten eij verglichen. Hierzu wird ein Chi-Quadrat-Test
durchgeführt.
Beispiel
An der Ruhr-Uni Bochum wurden StudentInnen befragt, wie sie die Anforderungen
ihres Studiums einschätzen. Es ergab sich folgender Befund:
|
Fakultät Anforderungen |
zu hoch | gerade noch zu bewältigen | gut zu bewältigen bzw. gering | Summe |
| Philologie | 10 (15,1) | 58 (62,3) | 47 (37,6) | 115 |
| Jura | 6 (15,8) | 69 (65,0) | 45 (39,3) | 120 |
| Wirtschaftswissenschaft | 18 (11,4) | 53 (47,1) | 16 (28,5) | 87 |
| Sozialwissenschaft | 3 (7,5) | 25 (30,9) | 29 (18,6) | 57 |
| Maschinenbau | 20 (7,2) | 30 (29,8) | 5 (18,0) | 55 |
| Summe | 57 | 235 | 142 | 434 |
Entschieden
werden soll, ob sich die Antworten über die Studienanforderungen zwischen
den ausgewählten 5 Fakultäten wesentlich unterscheiden. Die
Berechnung der erwarteten Häufigkeiten führt zu den eingeklammerten
Werten: z.B. für "Philologie" und "gerade noch zu bewältigen" ergibt
sich ein Wert von
![]()
Für die Prüfvariable u ergibt sich ein Wert von 63,3 (Die Berechnung
erfolgt analog zum Chi-Quadrat-Unabhängigkeitstest, S. 5).
Die
-Verteilung besitzt v=(r-1)(s-1)=4*2=8
Freiheitsgrade.
Der Rückweisungspunkt liegt für v=8 und ein Signifikanzniveau
von 10 Prozent bei 13,4 (Nachschlagen in Chi-Quadrat-Verteilung).
Der Stichprobenbefund u=63,3 liegt rechts vom entsprechenden
Rückweisungspunkt
=13,4,
die Hypothese muß zurückgewiesen werfen.
Ergebnis: Die Nullhypothese muß abgelehnt werden, die Stichproben
stammen nicht aus einer GG, die Unterschiede zwischen den Einschätzungen
der einzelnen Studiengänge sind signfikant.
1.1.3 X2-Unabhängigkeitstest
Testsituation:
-Unabhängigkeitstest prüft die Hypothese,
daß die beiden dichotomen/polytomen Merkmale in der Grundgesamtheit
voneinander unabhängig sind:
ij=
i.
.j
-Anpassungstest (S. 4)
-Unabhängigkeitstest bezeichnet.
Die
Tatsache, daß die Stichprobenverteilung des arithmetischen Mittels bei
normalverteilter Gesamtheit ebenfalls normalverteilt ist, läßt sich
bei bekannter Grundgesamtheitsvarianz nutzen. Ist diese jedoch unbekannt,
wäre eine entsprechende Schätzung über den Stichprobenbefund bei
kleinem Stichprobenumfang zu ungenau. Eine Prüfvariable, die dies
berücksichtigt, läßt sich mit Hilfe des
StUDENTisierung-Verfahrens gewinnen:
Bei normalverteilter Grundgesamtheit gilt:
.
Es läßt sich zeigen, daß
wie
verteilt
ist (S ist die zur Stichprobenstreuung gehörende Stichprobenvariable). Man
kann nun die Definition der Student-t-Variablen einsetzen und erhält die
Größe
1.2.2 t-Test bei einer kleinen Stichprobe
Testsituation:
Der Mittelwertdifferenzentest ist ein t-Test bei einem kleinen
Stichprobenumfang: n<30.
Voraussetzung ist, daß die Verteilung in der Grundgesamtheit entweder
dichotom oder normalverteil ist, sonst sollte man auf andere verteilungsfreie
(aber ebenso effiziente) Prüfverfahren ausweichen, z.B. den U-Test.)
Der t-Test testet, ob das arithmetische Mittel der Stichprobe sich signifikant
vom arithmetischen Mittel der Grundgesamtheit unterscheidet. Der t-Test nutzt
die Information, daß die Stichprobenverteilung des arithmetischen Mittels
bei normalverteilter GG ebenfalls normalverteilt ist. Diese Beziehung
läßt sich nutzen, wenn die Grundgesamtheitsvarianz ebenfalls 0
ist.
Es ergeben sich folgende Testsituationen:
Varianz in der Grund- |
bekannt
|
unbekannt
|
normalverteilt
|
|
|
|
Ausweichen
auf |
S
ist die zur Stichprobenstreuung gehörende Stichprobenvariable.
Vorgehensweise:
und dem
Parameter v=n-1) verglichen (Formelsammlung S. 31)
Testidee
Der t-Test für zwei unabhängige kleine Stichproben geht zurück
auf das Studentisierungs-Verfahren (s. S.7).
Bei kleinen Stichprobenumfängen lassen sich Aussagen über die
Verteilungen der bislang verwendeten Prüfgrößen nur machen,
sofern die Grundgesamtheiten normalverteilt sind. Ist dies nicht der Fall,
weicht man am besten auf verteilungsfreie Verfahren aus, z.B. den U-Test.
Testsituation
| Gruppe 1 | 13 | 15 | 17 | 18 | |
| Gruppe 2 | 14 | 16 | 18 | 22 | 23 |
1.
Die Nullhypothese lautet:
1=
2
2. Man berechnet die arithmetischen Mittel:
![]()
![]()
3. ... und die Varianzen
und
(für
den t-Test ist Voraussetzung, daß die GG normalverteilt sind und die
Varianzen der Gesamtheiten gleich sind

Der
t-Test für zwei verbundene Stichproben läßt sich als Problem
des t-Test-Ein-Stichproben-Falls (S.7) auffassen. Ausgegangen wird von der
Differenz der D=X1-X2. Aus den Paaren der
Stichprobenvariablen (Xi1,X2i) und berechnet daraus den
Durchschnitt:
(weiteres
siehe Formelsammlung)