3.5 Mann-Whitney-U-Test für zwei unabhängige Stichproben
Der
Mann/Whitney-U-Test gehört zu den stärksten Tests, um einen
Zusammenhang zwischen einer zweistufigen nominalskalierten Variablen und einer
ordinalskalierten Variablen zu testen. Man kann aber auch den Unterschied
zwischen zwei unabhängigen Stichproben hinsichtlich der ordinal skalierten
Variablen testen.
3.5.1 Testsituation
gleich,
ist eine Konstante:
Geprüft
wird, ob ein Zusammenhang zwischen zwei unabhängigen
Stichprobenverteilungen existiert, genau genommen, ob die Verteilungen fon
F1(x) und F2(X) bis auf eine Konstante gleich sind.
Die Hypothese lautet gewöhnlich: Ho:
=0, d.h. der
Parameter ist 0 -> es besteht ein Zusammenhang zwischen den beiden
Stichprobenverteilungen.
Die Alternativhypothese lautet:
!= 0
>0 oder
<0Man bildet nun die Indikatorvariable U mit
.
A)
Falls der Wert der ersten Stichprobe > als der Wert der zweiten Stichprobe
ist, wird aij=1 gesetzt: Falls xij>x2j
-> aij=1
B) Falls der Wert der ersten Stichprobe < als der
Wert der zweiten Stichprobe ist, wird aij=0 gesetzt:
Falls
xij<x2j -> aij=0
Falls die obige (Homogenitäts-)Hypothese zutrifft, muß die Anzahl
der Fälle von A so groß sein wie die Anzahl der Fälle von B -
abgesehen von zufälligen Abweichungen.
3.5.4 Vorgehensweise
1.
Wenn man einen großen Stichprobenumfang vorliegen hat (n>=20), kann
man U asymptotisch approximieren nach:

2. Falls u>0,5n1n2 ist, nutzt man die
Komplementärvariable von U U* aus.
(Es gilt:
U=n1n2-U*). Man berechnet den transformierten Wert u=
n1n2-u*.
3. Ab n2>=20 darf man als Näherung die Normalverteilung
benutzen, wobei man die Kontinuitätsberichtigung nach YATES
berücksichtigen muß.
4. Der Mann/Whitney-U-Test hat wegen der geringeren Voraussetzungen bei
Anwendungen eine relativ große Bedeutung, Er ist nur geringfügig
schlechter (95 Prozent Effizienz) als der vergleichbare t-Differenzentest
für zwei Mittelwerte.
3.5.6 Beispiel (Tiede S. 93)
Zwei
Leichtathletikgruppen mit fünf bzw. sechs Leuten (n1=5,
n2=6) machen einen Fitnesstest, nachdem sie ein unterschiedliches
Wintertraining durchgeführt haben. Jeder Athlet kann bis zu 20 Punkte
erreichen.
x1j
|
5
|
10
|
15
|
17
|
12
|
|
x2j
|
6
|
6
|
7
|
9
|
9
|
13
|
Geprüft werden soll: Unterscheiden sich die Gruppenmittel von 15 und 8 nur
zufällig voneinander? (5-Prozentiges Signifikanzniveau einseitig).
Mathematisch gesprochen prüft man, ob beide Stichproben aus einer
Gesamtheit stammen.
Die Hypothese lautet also : Ho:
=0 (-> es gibt keinen
signifikanten Unterschied zwischen Gruppe 1 und Gruppe 2), anders formuliert
(s.o) Ho:E(U):0,5n1n2
1. Die beiden Gruppen werden zu einer Gruppe zusammengefaßt. Jeder Wert
aus der ersten Stichprobe wird zur Kennzeichnung mit einer "0" markiert, die
Werte aus der zweiten Stichprobe bekommen eine "1".:
Gesamtgruppe
|
5
|
10
|
15
|
17
|
12
|
6
|
6
|
7
|
9
|
9
|
13
|
stammt
aus Gruppe:
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
Die
Gesamtstichprobe wird der Übersicht halber sortiert, und es werden
Ränge verteilt (Doppeltränge beachten!)
Gesamtgruppe
|
5
|
6
|
6
|
7
|
9
|
9
|
10
|
12
|
13
|
15
|
17
|
Kodierung
|
0
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
1
|
0
|
0
|
Ränge
|
1
|
2,5
|
2,5
|
4
|
5,5
|
5,5
|
7
|
8
|
9
|
10
|
11
|
x1j
|
5
|
10
|
15
|
17
|
12
|
6
|
6
|
7
|
9
|
9
|
13
|
x2j
|
1
|
7
|
9
|
10
|
11
|
2,5
|
2,5
|
4,
|
5,5
|
5,5
|
8
|
Der
Kruskal/Wallis-H-Test ist eine Verallgemeinerung des U-Tests von Mann/Whitney.
Er verwertet zusätzlich Informationen über die rangmäßige
Abstufung der Stichprobenwerte.
3.6.1 Testsituation
Es
wird geprüft, ob r unabhängige Stichproben, in denen eine stetige
Untersuchungsvariable betrachtet wird, aus r Grundgesamtheiten mit gleichem
Median stammen. Vereinfacht gesagt prüft man: stammen die r Stichproben
aus der gleichen oder identischen Grundgesamtheit.
Die Alternativhypothese behauptet: nicht alle Gesamtheiten haben den gleichen
Median, anders formuliert: die r Stichproben stammen aus verschiedenen
Grundgesamtheiten, wobei sich diese Verschiedenheit auf die Lageparameter
(Mittelwerte) bezieht.
1. Den Stichprobenwerten xij werden Rangzahlen Rg(xij)
zugeordnet, so daß für die zusammengefaßte Stichprobe eine
Rangreihe entsteht.
2. -> der kleinste Wert xij bekommt den Rang 1
3. man bildet in jeder Stichprobe die entsprechende Rangsumme
![]()
4. Der Mittelwert der Rangsumme lautet:
(-> Man dividiert für jede Stichprobe diese Summe durch die
entsprechende Anzahl Elemente)
5. Falls die Nullypothese zutrifft, wird man für
nur
zufällige Abweichungen ewarten.
6. Der Prüfwert ergibt sich aus der Formelvon Kruskal/Wallis:
3.6.3 Bemerkungen
1.
H kann für ni>=5 und r>=4 (Faustregel) einer [chi]²-Verteilung
mit r-1 Freiheitsgraden angenähert werden.
3.6.4 Beispiel (Tiede S. 99)
Für
eine geplante Fragebogenation wird über zufällig ausgewählte
Personen ausprobiert, wie zeitraubend die Bearbeitung einer Reihe von
Fragebogentypen ist. Man erhält die folgenden Zeitwerte in Minuten:
Fragebogentyp
|
Rangzahlen
des Zeitaufwands
| ||||||||||
1
|
11
|
14
|
16
|
19
|
27
|
29
|
30
|
31
|
40
|
41
|
42
|
2
|
15
|
17
|
18
|
25
|
26
|
32
|
33
|
33
|
42
|
43
| |
3
|
20
|
21
|
30
|
32
|
35
|
38
|
45
|
50
|
55
|
56
| |
4
|
8
|
10
|
12
|
13
|
22
|
28
|
28
|
28
|
32
|
33
|
1. Man ordnet den Ursprungswerten Rangzahlen zu und erhält folgende
Tabelle:
Fragebogentyp
|
Rangzahlen
des Zeitaufwands
|
Rangsummen
| ||||||||||
1
|
3
|
6
|
8
|
11
|
17
|
21
|
22,5
|
24
|
33
|
34
|
35,5
|
215
|
2
|
7
|
9
|
10
|
15
|
16
|
26
|
29
|
29
|
35,5
|
37
|
213,5
| |
3
|
12
|
13
|
22,5
|
26
|
31
|
32
|
38
|
39
|
40
|
41
|
294,5
| |
4
|
1
|
2
|
4
|
5
|
14
|
19
|
19
|
19
|
26
|
29
|
138
| |
861
| ||||||||||||
2.
Man berechnet H nach der obigen Formel und erhält: h=8,76.
3. Da r>=4 und ni>=5 ist, folgt H hinreichend genau einer
[chi]²-Verteilung mit (4-1)=3 Freiheitsgeraden.
4. Man liest aus der [chi]²-Tabelle in der Formelsammlung auf Seite 30
den Rückweisungspunkt [chi]²r = 7,81 ab (-> 5 Prozent
Signifikanzniveau).
5. 8,76>7,81, d.h. die Nullhypothese, daß die Unterschiede zwischen
den Fragebögen nicht zufällig sind, wird abgelehnt: Es existieren
Unterschiede bei dem Zeitaufwand für die Fragebögen.
Der Vorzeichentest (-> Schnelltest) kommt beim gleichen Beispiel zu einem
anderen Ergebnis, der Kruskal-Wallis-Test hat eine Effizienz von 95%, seine
Entscheidung gilt im Zweifelsfalle mehr.
3.7 Prüfung des Rangkorrelationskoeffizienten
Der
SPEARMANsche Rangkorrelationskoeffizient dient zur Beurteilung des
Zusammenhangs zweier stetiger Untersuchungsvariablen:
wobei i: di =Rg(yi) ist
3.7.1 Testsituation
Geprüft
wird, ob die Merkmale von X und Y in der Grundgesamtheit nicht korreliert sind,
d.h. die Hypothese lautet: in der Grundgesamtheit hat der
Rangkorrelationskoeffizient den Wert 0. Anders formuliert: X und Y sind
statistisch unabhängig voneinander
Ho: }Sp=0, Ha=}sp!=0
Nun wird es in der Stichprobe unter Umständen immer so sein, daß die
gezogene Stichprobe einen Rangkorrelationskoeffizienten hat, der nicht Null
ist. Mathematisch formuliert lautet das Problem:
[delta]sp<->Ysp, rsp!=0
Lösungsidee: Man wählt eine geeignete Prüfvariable, hier den
Rangkorrelationskoeffizienten selbt.
Um die Stichprobenverteilung zu ermitteln, ordnete man die Rangzahlen
Rg(xi) 1 2 3 ... n
Falls x und y unkorreliert sind, ist jede Beliebige Anordnung für
Rg(yi) möglich, auch eine vollständige geordnete
(absteigend/aufsteigend), die zur vollständigen Korrelation führen
würde.
Bei n verschiedenen Elementen gibt es n! gleichmögliche verschiedene
Möglichkeiten einer Ordnung für Rg(yi).
Beispiel: für n=3 ergeben sich folgende Kombinationsmöglichkeiten
für Rg(yi), sowie die folgenden Rangkorrelationskoeffizienten
rsp. Daraus ergibt sich die Wahrscheinlichkeitsverteilung
Rg(xi)
|
1
|
2
|
3
|
rsp
|
Rg(yi)
|
1
|
2
|
3
|
1
|
1
|
3
|
2
|
0,5
| |
2
|
1
|
3
|
0,5
| |
2
|
3
|
1
|
-0,5
| |
3
|
1
|
2
|
0,5
| |
3
|
2
|
1
|
1
|
P(1)=1/6,
P(0,5)=1/3, P(-0,5)=1/3, P(-1)=1/6. Graphisch ergibt sich folgendes Bild:

Die Stichprobenverteilung Rsp ist also diskret und symmetrisch zum
Wert E(Rg)=0. Ihre Varianz ist VAR (Rsp)=
.
Die Rückweisungspunkte in Abhängigkeit von n und dem
Signifikanzniveau sind in der Formelsammlung auf Seite 46 für n<11
tablliert. Ist n größer als 9, kann man approximativ die t-verteilte
Prüfvariable
mit v=n-2 Freiheitsgraden verwenden.
Ab n>20 kann
durch die Standardnormalverteilung N(0,1) approximiert werden.
Annahmebereich der Testvariablen
3.8 Literatur
Tiede,
Manfred; Voß, Werner
|
Prüfverfahren
in der Wirtschafts und Sozialstatistik
|
Studienverlag
Brockmeyer, 1982
|
|
Billeter,
Ernst P.
|
Grundlagen
der erforschenden Statistik
|
Springer-Verlag
|
UB
AXB226
|
Graff,
Jörg
|
Nichtparametrische
Statistik in den Sozialwissenschaften
|
Centataurus-Verlagsgesellschaft
|
UB
CSA2997
|