Eine zweidimensionale Häufigkeitsverteilung erhält man, wenn von N Merkmalsträgern zwei verschiedene Variablen (Merkmale) erhoben werden. Eine solche zweidimensionale Häufigkeitsverteilung läßt sich adäquat in Form der sog. Kreuztabelle darstellen.
Bespiel:
Erhoben werden das Geschlecht und der höchste erreichte Schulabschluß. Daß Ergebnis wird in Form einer Kreuztabelle zusammengefaßt.
Üblicherweise werden die Ausprägungen der unabhängigen Variablen (hier offensichtlich das Geschlecht) in den Spalten, die Ausprägungen der abhängigen Variablen in den Zeilen eingetragen, sofern eine begründete Hypothese über die Richtung eines eventuellen statistischen Zusammenhanges vorliegt. In diesem Beispiel ist klar, daß das Geschlecht nicht vom Schulabschluß abhängen kann.
Geschlecht (Xj) |
|||
---|---|---|---|
Abschluß (Yi) |
männlich (x1) |
weiblich (x2) |
|
Hauptschule (y1) |
f11(y1|x1) |
f12(y1|x2) |
f1. |
Realschule (y2) |
f21(y2|x1) |
... |
f2. |
FHS-Reife (y3) |
... |
... |
f3. |
Abitur (y4) |
... |
fi(y4|x2) |
f4. |
|
f.1 |
f.2 |
N |
Die Summenspalte enthält die eindimensionale Häufigkeitsverteilung der abhängigen Variablen, die Summenzeile die eindimensionale Häufigkeitsverteilung der unabhängigen Variablen.
Die inneren Tabellenfelder (grau markiert) enthalten die sog. bedingte Verteilung in Form der absoluten Häufigkeiten.
Die bedingten relativen Häufigkeiten Ergeben sich durch Division der inneren Tabellenfelder durch die jeweilige Spaltensumme.
Die einfachen relativen Haufigkeiten erhält man durch Divison der Spalten- bzw. Zeilensummen durch N.
Die sog. relative Häufigkeit des gemeinsamen Auftretens zweier Merkmalsausprägungen von X und Y erhält man durch Division der absoluten bedingten Verteilung (grau) durch N.
Die allgemeine Schreibweise einer Kreutabelle für zwei Variablen X mit s Merkmalsausprägungen und Y mit z Merkmalsausprägungen ist:
|
X1 |
X2 |
. . . |
Xj |
... |
Xs |
Sum |
---|---|---|---|---|---|---|---|
Y1 |
f11 |
f12 |
|
f1j |
|
f1s |
f1. |
... |
|
|
|
|
|
|
... |
Yi |
fi1 |
fi2 |
|
fij |
|
fis |
fi. |
... |
|
|
|
|
|
|
|
Yz |
fz1 |
fz2 |
|
fzj |
|
fzs |
fz. |
|
f.1 |
f.2 |
. . . |
f.j |
|
f.s |
N |
Wie
läßt sich nun prüfen, ob zwei Variablen X und Y
statistisch unabhängig sind?