Zusammenhangsmaße für ordinalskalierte Daten

Probleme bei der Bildung einer Rangreihe

In der zuletzt bearbeiteten Aufgabe war die Bildung von Rangreihen unproblematisch. Es kann jedoch auch der Fall eintreten, daß mehrere Merkmalsträger den gleichen Rang zugewiesen bekommen müßten (wenn z.B. im Falle der letzten Aufgabe mehrere Gewebe die gleiche Anzahl Scheuertouren überstanden hätten). In einem solchen Falle wird das artihmetische Mittel der in Frage kommenden Ränge zugewiesen. Lassen sich z.B. Rang 3 und 4 nicht eindeutig vergeben, erhalten beide Fälle den Rang 3,5.

Umgang mit Daten in Tabellenform

In den bisher behandelten Beispielen war die Fallzahl N stets sehr klein, so daß mit Rohwerten gearbeitet werden konnte. Mit zunehmendem N wird man natürlich immer mehr Fälle erhalten, die sich hinsichtlich einer oder beiden Variablen gleichen (Ties). Es wird dann notwendig, diese Fälle zusammenzufassen und in die Verteilung in die Form einer zweidimensionalen Häufigkeitstabelle zu bringen.

Betrachten wir dazu ein Beispiel:


Einkommen von 0 bis unter 2400 DM

Einkommen von 2400 bis unter 3600 DM

Einkommen von 3600 bis unter 21000 DM

Miete von 0 bis unter 300 DM

794

360

151

1305

Miete von 300 bis unter 550 DM

646

701

524

1871

Miete von 550 M und mehr

103

287

441

831

1543

1348

1116

4007



Für die Bestimmung konkordanter, diskordanter Paar und Ties wird folgendes Verfahren angewandt:

Berechnung der konkordanten Paare

Berechnung der diskordanten Paare

Berechnung der Ties in X

Die Ties in Y werden analog durch Multiplikation innerhalb der Zeilen errechnet. Es ergibt sich hier ein Wert von Ty = 1820319

Die Ties in XY sind die Paare innerhalb der Tabellenfelder. Ihre Anzahl wird mit der Formel bestimmt. In diesem Falle ergeben sich 1124791 Ties in XY.

Jetzt können weitere Maßzahlen berechnet werden, welche die Ties in unterschiedlicher Art und Weise berücksichtigen.

Zusammenhangsmaß

Formel

Eigenschaften

Kendall's Tau

wenn keine Ties vorkommen


für quadratische Tabellen



m=min(s,z)

für rechteckige Tabellen

Somer's d


Annahme: Y ist eine Funktion von X


Annahme: X ist eine Funktion von Y

Goodman/Kruskal's gamma

Keine Berücksichtigung von Ties



Übung

Berechnen Sie die in der Tabelle aufgeführten Maßzahlen für obiges Beispiel. Versuchen Sie folgende Fragen zu beantworten (antworten Sie wie üblich mit einem kleinen "j" oder "n"):



Die Interpretation aller Konkordanzmaße ist unproblematisch, da sie in einem Wertebereich zwischen -1 und +1 liegen.


sind nur schwer interpretierbar, da der Nenner nicht empirisch begründbar ist.


Für Werte zwischen -1, 0 und +1 ist ein lineares Verhältnis zwischen dem Zahlenwert der Konkordanzmaße und der tatsächlichen Stärke des statistischen Zusammenhangs gegeben.


Die Auswahl der zu verwendenden Maßzahlen hängt davon ab, in welcher Richtung ein Zusammenhang vermutet wird.


Beim Fehlen von Ties ist es sinnvoll, die verschiedenen Varianten von Somer's d berechnen


Der Zusammenhang zwischen den Beiden Variablen Miete und Einkommen im obigen Beispiel ist meiner Interpretation nach