Druckversion: | Nach dem Drucken: | und zurück zum Dokument |
Sollte das Drucken mit diesem Schaltknopf nicht funktionieren, nutzen Sie bitte die Druckfunktion in Ihrem Browser: Menü Datei -> Drucken
ViLeS 1 > XII Erweiterungen des linearen Regressionsmodells > XII-1 Regression und Korrelation mit dichotomen Regressoren > Konzepte und Definitionen |
Die Definition: d ist eine dichotome (binäre) Variable mit zwei Ausprägungen.
Ein Beispiel: Das Merkmal Geschlecht mit den Ausprägungen weiblich (w) und männlich (m).
Die Codierung: In der Regel setzt man die Werte d = (0 , 1) , z. B.: entweder (w = 0, m = 1) oder (w = 1, m = 0). Gebräuchlich ist für d dann auch die Bezeichnung "Dummy-Variable".
Der Status: Im Regressionsansatz ist d = (0 , 1) die unabhängige Variable und x1 die abhängige Variable .
Die Regressionsbeziehung: Angenommen wird folgender Zusammenhang: x1c = f(d).
Ein Beispiel für einen Regressionszusammenhang: Als Beispiel soll angenommen werden, dass die Höhe des Einkommens vom Geschlecht beeinflusst wird.
Die Funktionsform:
Die Regressionsfunktion x1c = f(d)
lautet:
x1c = a* + b* · d
Die graphische Darstellung:
Die Punktwolke im Koordinatensystem besteht aus zwei Verteilungen, der Verteilung der x1 für d1 = 0 und für d2 = 1. Dabei verläuft die Funktion durch die Mitten der Verteilungen:
Abbildung 12-1: Die Funktion im Koordinatensystem
Die Ermittlung:
Die Parameter a* und b* der Regressionsfunktion mit einem dichotomen Regressor ergeben sich nach der Methode der kleinsten Quadrate für x2 = d gemäß den in Kap. 11 vorgestellten Formeln.
Die Fehlerquadrate werden minimiert, wenn die Regressionsfunktion, wie in Abb. 12-1 gezeigt, durch die arithmetischen Mittel der beiden Verteilungen verläuft.
Somit entspricht a* dem Durchschnitt der x1 für d1 = 0 und b* der Differenz der beiden Durchschnitte.
Die graphische Veranschaulichung
Abbildung 12-2: Die Funktionsparameter
Erläuterung
Beispiel
a* entspräche im obigen Beispiel also dem Durchschnittseinkommen der Frauen,
b* entspräche der Differenz zwischen dem Durchschnittseinkommen der Männer und dem der Frauen.
Die Ermittlung von R und R2: Wie schon bei der rechnerischen Bestimmung der Regressionsparameter stützt sich die Berechnung des Korrelations- und des Determinationskoeffizienten auf die entsprechenden Formeln in Kap. 11.
Interpretation: R2 verkörpert demnach das Ausmaß der Varianz von x1, das durch den Regressor d erklärt wird.
Beispiel: Im obigen Beispiel wird die Stärke des Zusammenhangs zum Einen von den Unterschieden der Durchschnittseinkommen der Geschlechter zum Anderen von der Streuung der Einkommen innerhalb der beiden Gruppen bestimmt (vgl. dazu auch Abb. 12-1).
letzte Änderung am 28.2.2020 um 7:49 Uhr.
Adresse dieser Seite (evtl. in mehrere Zeilen zerteilt)
http://viles.uni-oldenburg.de/navtest/viles1/kapitel12_Erweiterungen~~ldes~~llinearen~~lRegressionsmodells/modul01_Regression~~lund~~lKorrelation~~lmit~~ldichot
omen~~lRegressoren/ebene01_Konzepte~~lund~~lDefinitionen/12__01__01__01.php3