Die Maßzahl
folgt
einer anderen, einfacheren Konstruktionslogik als
.
Es werden zwei Arten von Vorhersagefehlern einander
gegenübergestellt: Zum einen der Vorhersagefehler auf der
Grundlage der einfachen (unbedingten) Häufigkeitsverteilung und
zum anderen der Vorhersagefehler auf der Basis der zweidimensionalen
bedingten Häufigkeitsverteilung.
Nehmen wir noch einmal das Beispiel vom Anfang:
Psychische Konstitution |
Geschlecht |
||
Männlich |
Weiblich |
|
|
Äußerst labil |
3 |
16 |
19 |
Labil |
22 |
18 |
40 |
Stabil |
32 |
9 |
41 |
Sehr stabil |
5 |
1 |
6 |
|
62 |
44 |
106 |
Soll nun auf der Basis der einfachen Häufigkeitsverteilung der abhängigen Variable (also der Summenspalte) eine möglichst sichere Prognose abgegeben werden, so orientiert sich diese natürlich am Modus der Verteilung, d.h. man würde ohne Information über die unabhängige Variable die wenigsten Fehler begehen, wenn man prognostiziert: "Wenn ich aus den N=106 Probanden einen herausgreife, so wird seine/ihre psychische Verfassung labil sein." Mit dieser Aussage irrt man sich in 106-41=65 Fällen. Es ist
F1 = N - max(fi)
F1=106-41=65
Dies ist der Prognosefehler ohne Berücksichtigung der unabhängigen Variablen. Nun wäre es natürlich ein Indiz für einen Zusammenhang der beiden Variablen, wenn sich der Prognosefehler durch Berücksichtigung der unabhängigen Variablen vermindern ließe. Dieser Fehler ergibt sich als:
also
Summe der Spaltensummen minus dem jeweiligen Spaltenmaximum
hier: F2=(60-32)+(44-18)=54
ergibt
sich als Maß der relativen Fehlerdifferenz:
hier:
Übung
Welche Eigenschaften hat
aufgrund
seiner Konstrukion? Antworten Sie bitte mit kleinem "j"
oder kleinem "n"!