2 Tests bei nominalem Meßniveau
2.1 Vorbemerkung
Bei
nominalskalierten Daten ist der Anteilswert die statistische Maßzahl beim
Testen.
Bei einem großen Stichprobenumfang dient die Normalverteilung als
Stichprobenverteilung.
2.2 Binominaltest (= Anteilswerttest)
2.2.1 Testsituation
Geprüft
werden soll, ob die Verteilungsfunktion F(x) der Zufallsvariablen X der durch
die Hypothese festgelegten Verteilungsfunktion Fo(x) entspricht,
d.h.
Ho: F(x)=Fo(x). Da die Variable dichotom ist, kann man
vereinfachen zu Ho:
=
o
Man prüft also, ob die Verteilung der Variablen X in der Stichproben
der in der Grundgesamtheit entspricht.
Der Rückweisungspunkt beim Binominaltest ist durch das
Signifikanzniveau gegeben. Da ein Signifikanzniveau von 0,05 oder 0,10 etc.
nicht exakt tabelliert ist, muß man den Punkt ungefähr bestimmen und
modifiziert die Nullhypothese Ho:
<=
o . Jeder Wert <= dem
Rückweisungspunkt ist Rückweisungspunkt.
2.2.3 Methode
Da
wir nur zwei Klassen vorliegen haben,
1. zählt man die Besetzungszahlen der beiden Klassen aus und
2. berechnet man die relativen Häufigkeiten p bzw. 1-p
In der Regel ergibt sich ein Unterschied zwischen der Verteilung der
Grundgesamtheit und der Stichprobe. Geprüft wird nun, ob der Unterschied
zufällig oder signifikant ist. (Signifikanzniveau beispielsweise 5 %).
2.2.4 Beispiel I (Vorlesung)
Ein
Hersteller von Geräten behauptet, daß höchstens 5 Prozent
defekte Stücke produziert werden. Per Zufall werden 20 Stücke
entnommen. 3 Stücke sind defekt.
Frage: Kann man dem Hersteller bei 10% Signifikanzniveau trauen?
Folgende Werte sind gegeben:
o<=0,05 (Es sind höchstens 5 Prozent
kaputt sind, 5 %=0,05;
entspricht der Erfolgswahrscheinlichkeit, ein
fehlerhaftes Stück aufzufinden)
a>0,05 (in Wirklichkeit ist die Zahl der
defekten Stücke größer als 5 Prozent)
=0,05 oder 5%)
) (Auszug aus Formelsammlung B-Verteilung, Tafel
9):n
|
X
|
0,050
|
20
|
0
|
0,358
|
1
|
0,377
| |
2
|
0,189
| |
3
|
0,060
| |
4
|
0,013
| |
5
|
0,002
| |
6
|
0,000
|
Die
Wahrscheinlichkeit, daß mehr als 3 defekte Stücke auftreten,
P(X>=3) ist 0,073 (->man addiert die Werte ab 3 bis 20). 0,073 <=0,10,
d.h. der Rückweisungspunkt würde unterschritten.
Die Wahrscheinlichkeit, daß mehr als 2 defekte Stücke auftreten,
P(X>=2) ist 0,262 (->man addiert die Werte ab 3 bis 20). 0,262 >=0,10,
d.h. der Rückweisungspunkt würde überschritten.
Der Wert für den Rückweisungspunkt läge zwischen 2 und 3, man
wählt den Punkt, bei dem Ho höchstwahrscheinlich nicht
verworfen wird, d.h. der Rückweisungspunkt lautet nicht mehr
pr=0,10, sondern pr<=0,10, formal korrekt geschrieben:
P(X>=xr)<=0,10. Diese Verschiebung des Signifikanzniveaus
bezeichnet man als "Konservativer Test":
Der Punkt, der für die Beibehaltung der Ho tendenziell
günstig liegt (Beispiel: genau 10% Signifikanzniveau) ist nicht
möglich. Man wählt daher ein kleineres Signifikanzniveau, um die
Ho beibehalten zu können. Beim konservativen Testen werden die
Parameter abgeschätzt, die Ho im Zweifel eher angenommen.
Ergebnis: Der Stichprobenbefund von drei oder mehr defekten Stücken
führt zur Rückweisung der Ho. Maximal zwei defekte
Stücke sind erlaubt.
2.2.5 Beispiel II: klassische Aufgabenstellung für den Binomialtest
Zu
testen ist die Hypothese, daß der Anteil weiblicher Studierender an der
Ruhr-Uni-Bochum bei 50% liegt (Signifikanzniveau: 10 % einseitig). In einer
Zufallsstichprobe werden n=16, x=4 Frauen beobachtet.
Frage: Sind die Frauen unterrepräsentiert?
=0.5 konstant.
), x folgt hier B(16, 0.5). Untersucht
werden muß, ob der Stichprobenbefund (4 Frauen) oder ein noch weiter von
der Hypothese abweichender Punkt (3, 2, 1, keine Frau) realisiert wird.
, wird die H0 angenommen
, wird die H0 abgelehnt
0.039Der
Binominaltest ist ein konservativer Test. Er begünstigt die Annahme der
Nullhypothese.
2.3 McNEMAR-Test
2.3.1 Testsituation
Der
McNemar-Test ist ein Homogenitätstest, der sich eignet für
|
! |
Wenn die Variablen mehrstufig sind, z.B. die Religionszugehörigkeit, muß man dichotomisieren, z.B. Katholiken gegen Nichtkatholiken oder christliche Religionen gegen andere. |
Der
McNemar-Test gehört zu den binominalen Testverfahren. Er kann angewendet
werden, wenn eine Vierfeldertafel vorliegt und wenn untersucht werden soll, ob
sich bestimmte Merkmalskombinationen in bedeutsamer Weiser verändert
haben.
Gegeben sind zwei Alternativmerkmale, die jeweils zwei Variationen aufweisen
(dichotome Variable).
Es werden nun die Anzahl der Wechsler betrachtet, d.h. der Elemente, die in der
zweiten Stichprobe eine andere Merkmalsausprägung angenommen haben. Man
prüft, ob sich der Anteilswert von den Wechslern (siehe Beispiel unten)
signifikant von 0,5 unterscheidet. 0,5 ist deshalb der Entscheidungswert, weil
es sich um eine dichotome Variable handelt, deren Erfolgswahrscheinlichkeit 0,5
beträgt. Letztendlich wird ein Binominaltest durchgeführt, der zur
Abweisung oder Annahme der Variablen führt (Details siehe Beispiel).
Der McNemar-Test ist ein konservativer Test, der oft bei
vorher-nachher-Erhebungen oder mit-ohne Erhebungen durchgeführt wird.
2.3.3 Beispiel (Tiede S. 54)
Vor
und nach einer Parteiveranstaltung werden die Besucher nach ihrem Wahlverhalten
in Bezug auf diese Partei befragt. Für den McNemar-Test interessiert nun
die Anzahl der Personen, die ihre Wahlabsichten geändert haben (->
Wechsler).
vorher[arrowdown]
|
nachher->
|
vorher
|
nachher
|
Summe
|
Partei
wird gewählt
|
30
|
35
|
65
| |
Partei
wird nicht gewählt
|
30
|
25
|
55
| |
Summe
|
60
|
60
|
120
|
Zu diesem Zweck stellt man die Tabelle folgendermaßen um, um die Differenz zwischen vorher und nachher deutlich machen zu können:
Summe
| ||||
Partei
wird nicht gewählt
|
Partei
wird gewählt
|
|||
Partei
wird gewählt
|
25 |
5 |
30
| |
vorher
|
Partei
wird nicht gewählt
|
10 |
20 |
30
|
Summe
|
35
|
25
|
60
|
In
den vier Feldern stehen die Anzahl der Leute, die ihre Meinung geändert
haben (b=5, c=10) Personen, sowie der Anzahl der Leute, die ihre Meinung
beibehalten haben (a=25, d=20).
Falls die Nullhypothese
zutrifft, wird man erwarten, daß sich c und b nur zufällig
voneinander unterscheiden. Als Prüfvariable dient hier beispielsweise (!)
die Zahl der Wechsler b.
Sie ist, wenn die Nullhypothese zutrifft, binominalverteilt nach B(b+c; 0,5).
Für c gilt das gleiche!
Das heißt, man kann hier einen Binominaltest (vgl. S. 13)
durchführen, der testet, ob sich der Anteilswert
signifikant von 0,5 unterscheidet.
Auf das Beispiel angewendet ergibt sich:
![]()
Die Rückweisungspunkte der vorliegenden Binominalverteilung B(15;0,5)
liest man nun in Tiedes Buch, S. 153, Tabelle 3, oder in der Formelsammlung
(Tabellierung für Median-Vorzeichen-Test) ab. Die Rückweisungspunkte
lauten 3 und 12 bei einem Signifikanzniveau von 5 %.
und
Da 0,2 (-> 1. Rückweisungspunkt) <= 0,33 (Prüfwert) <= 0,8
(-> 2. Rückweisungspunkt) ist, wird die Nullhypothese angenommen. D.h.
der Unterschied zwischen vorher und nachher ist zufällig. Das heißt
ebenfalls: De Anteilswerte
und
unterscheiden sich nicht signifikant voneinander.
Auf den praktischen Inhalt der Aufgabe bezogen heißt das, daß die
Wahlveranstaltung die Chancen der Partei nicht wesentlich verändert
hat.
Der McNemar-Test nutzt die Tabellierung für den Median-(Vorzeichen)-Test.
2.4 Differenzentest für zwei Anteilswerte aus zwei großen unabhängigen Stichproben
Tiede
faßt die Ergebnisse des ersten Bandes, S. 160 und S. 182, zusammen, in
dem die Stichprobenverteilung der Differenz zweier Anteilswerte bereits
erörtert wurde.
2.4.1 Testsituation
Gegeben
ist eine Stichprobe mit den Anteilswert
1. Über die
Grundgesamtheit vermutet man jedoch einen Grundgesamtheitsanteilswert von
2. Ist der Unterschied zufällig oder signifikant?
Bei großem Stichprobenumfang und unbekannten Grundgesamtheitsangaben kann
man die Stichprobenverteilung der Differenz zweier Anteilswerte durch eine
Normalverteilung approximieren.
Die Rückweisungspunkte für die Hypothese
Ho:
1-
2=[delta] lauten:

Da man
1 und
2 nicht kennt, wird
1
und
2=0 geschätzt. Der Fischer-Test ist hier der bessere
Lösungsweg.
Voraussetzung ist allerdings, daß die Anteilswerte nicht zu nahe bei Null
liegen dürfen
Falls die Stichprobe klein ist, greift man zum Fisher-Test (siehe S. 17)
2.5 FISHER-Test
2.5.1 Testsituation
Der
Fishertest ist eine Sonderform des [chi]2-Test, insofern also auch ein
Anpassungstest.
Mit dem Fisher-Test läßt sich eine Vierfelderverteilung prüfen,
auch wenn die Stichprobe und damit die erwarteten und beobachteten
Häufigkeiten klein sind.
Mit Hilfe der hypergeometrischen Verteilung, die für diskrete
Variablen definiert ist, kann man exakt die Wahrscheinlichkeit bestimmen, mit
der bei gegebenen univariaten Randverteilungen eine bestimmte
Häufigkeitverteilung in den vier Feldern der Tabelle auftritt.
Geprüft werden soll: Ho: F1(X)=F2(X)
für alle x, d.h. die Verteilung der ersten Stichprobe entspricht der der
zweiten Stichprobe, beide Stichproben stammen aus der gleichen
Grundgesamtheit.
Eine Vierfeldertafel sei folgendermaßen notiert:
Ausprägung
des Merkmals -> |
a
|
|
Summe
|
1
|
x1
|
n1-x1
|
n1
|
2
|
x2
|
n2-x2
|
n2
|
Summe
|
x
|
n-x
|
n
|
Falls
die Nullhypothese zutrifft, unterscheiden sich die Anteilswerte
nur
zufällig voneinander.
Gesucht ist die Wahrscheinlichkeit für X1|x unter der
Bedingung, daß Ho in Wahrheit zutrifft.
Um den Unterschied zwischen p1 und p2 zu beurteilen,
genügt es, sich mit x1 (oder x2) zu befassen, da die
anderen Werte (x=
1n=
2n=
n und n1
und n2) bekannt sind, bzw. sich errechnen lassen (-> Nur ein Feld
in der 2x2-Tafel ist frei variierbar).
Man numeriert die Stichproben so um, daß x1 <= die anderen
drei Häufigkeiten ist!
Die Prüfgröße X1 folgt bei korrekter Nullhypothese
X1 einer hypergeometrischen Verteilung mit:

Eigenschaften von x1:
Während
einer Industrieausstellung wurden 5 Vertreter inländischer Unternehmen und
6 Vertreter ausländischer Unternehmen über ihren Eindruck vom
Geschäftsklima befragt:
Änderung
des Geschäftsklimas -> |
Verschlechterung
|
Verbesserung
|
Summe
|
Inländisch
|
1
|
4
|
5
|
Ausländisch
|
5
|
1
|
6
|
Summe
|
6
|
5
|
11
|
Geprüft werden soll: Sind die Unterschiede in den Antworten zufällig
(Ho) oder nicht (Ha)?
Ho (umformuliert):
und
unterscheiden sich nur zufällig voneinander.
