Druckversion:
Nach dem Drucken:
und zurück zum Dokument

Sollte das Drucken mit diesem Schaltknopf nicht funktionieren, nutzen Sie bitte die Druckfunktion in Ihrem Browser: Menü Datei -> Drucken

ViLeS 1 > II Tabellarische und graphische Aufbereitung eindimensionaler statistischer Daten > II-4 Die tabellarische Darstellung klassierter Daten > Konzepte und Definitionen

Konzepte und Definitionen im Modul II-4 Die tabellarische Darstellung klassierter Daten

1. Vorbemerkungen

a) Die Klassierung der statistischen Daten: Vorzüge und Fallstricke

Wie die nachstehende Tabelle der Urlaubsausgaben aus Kap. II-2 zeigt, reicht in vielen Fällen die durch Gruppierung vorgenommene Reduktion des Tabellenumfangs nicht aus, die gegebenen Informationen schnell und substantiell aufzunehmen.

Tabelle 2-7: Häufigkeiten der Urlaubsausgaben



Deshalb sollen in den folgenden Aufbereitungsschritten die gruppierten Daten nochmals verdichtet werden. Dazu bedient man sich der Klassierung, bei der die Merkmalsausprägungen in Klassen zusammengefasst werden.

Bei der Klassierung ist zu beachten, dass die Unterschiede in den Merkmalsausprägungen innerhalb der Klassen nivelliert werden, so dass relevante Informationen über die einzelnen Merkmalsausprägungen verloren gehen. Darüber hinaus kann durch die Festlegung der Klassen die Verteilungsstruktur der Daten, wie sie in dem entsprechenden Histogramm (vgl. Abb. 2-8 aus Kap. II-3) zum Ausdruck kommt, verwischt werden.

Abbildung 2-8: Histogramm der Urlaubsausgaben



Deshalb gilt es bei der Klassierung eine ausgewogene Balance zwischen dem Informationsverlust, dem Gewinn an Anschaulichkeit und der Bewahrung der Verteilungsstruktur zu finden.

a) Möglichkeiten der Klassierung der statistischen Daten

Unter diesem Aspekt soll in den folgenden Abschnitten diskutiert werden, wie die gruppierten Daten der Urlaubsausgaben in Klassen eingeteilt werden können. Dabei ist zu klären:

2. Die Optionen der Klassenbildung

a) Die Festlegung der Klassengrenzen

Wichtigstes Kriterium beim Setzen von Klassengrenzen ist, dass sich diese nicht überschneiden dürfen. Jede Klasse muss eindeutig abgegrenzt sein. Dies betrifft:

Da sich z.B. die Klassen "0 bis 500 €" und "350 bis 700 €" überschneiden, wäre diese Einteilung nicht erlaubt! Ebenso wenig wären die Klassen "0 bis 350 €" und "350 bis 700 €" eindeutig, da Ausgaben in Höhe von 350 € beiden Klassen zugeteilt werden könnten.

b) Die Festlegung der Anzahl der Klassen

In den Extremfällen könnte eine einzige Klasse gebildet werden, in der sich alle Beobachtungen wiederfinden, oder so viele Klassen, dass jede Klasse die Beobachtungen der gruppierten Daten aufweist. Beide Modelle sind unter den obigen Zielsetzungen nicht sinnvoll. Durch die Klassierung sollen die Daten übersichtlicher gestaltet werden. Mehr als 8 - 10 Klassen sollten also die Ausnahme darstellen. Die endgültige Wahl der Anzahl muss jedoch auch die folgenden Aspekte einschließen.

c) Die Gestaltung der Klassenbreiten

d) Die Festlegung der Klassenmitten

Wenn es um sehr differenzierte Daten geht, die zudem auch eher als ungefähre Angaben ermittelt wurden, so z.B: Angaben zum Einkommen, zur Miete etc., ist eine Zentrierung der Klassenmitten auf die Häufungspunkte sinnvoll. Viele Befragte werden z.B. ihr Einkommen oder ihre Urlaubsausgaben eher auf volle hundert € Beträge auf- bzw. abrunden, als den exakten Betrag in Euro und Cent anzugeben (vgl. dazu z.B. das obige Diagramm). So kann es hier und im allgemeinen sinnvoll sein, einen runden Hunderterbetrag wie z.B. den Betrag von 400 € in die Mitte einer Klassen zu legen ("350 bis unter 450 €").
Dieses Vorgehen hat einen weiteren Vorteil: da der Ausschuss oder die Einbeziehung der Obergrenzen einer Konvention "bis unter ..." folgt, könnte es bei einer Änderung der Konvention unangebrachte Verschiebungen geben. Probanden, die "300 €" angaben, fänden sich einmal in der Klasse "von 300 bis unter 400 €", das andere Mal in der Klasse "mehr als 200 bis einschließlich 300 €" wieder: Das Bild wäre dann ein ganz anderes.

3. Die Berechnung der Klassenmitten und der Häufigkeitsdichten

Zur Ermittlung von statistischen Maßzahlen aber auch zur graphischen Darstellung der klassierten Häufigkeitstabelle ist eine weitere Bearbeitung der Informationen dieser Verteilung notwendig. Es ist dabei sinnvoll mit einer Arbeitstabelle zu arbeiten, insbesondere wenn ungleiche Klassenbreiten oder offene Klassen verwendet wurden.