Regression auf eine binäre Variable

Regressionsmodelle aller Art mit Stata.

Regression auf eine binäre Variable

Beitragvon Erich » Fr 14. Feb 2014, 15:32

Kann mir bitte Jemand beantworten, ob ich eine Regression des logarithmierten Lohnes
auf die dichotome Variable "männlich" in Stata einfach so durchführen kann ? Gesucht wird der Effekt von männlich.

Wenn ich männlich nicht als Dummyvariable einstelle bekomme ich normal erscheinende Regressionsergebnisse. Aber das Ergebnis
ist doch verwaschen ? Weil die Löhne der Frauen mit eingeflossen sind ?

Ich hatte als zweite Möglichkeit eine Dummyvariable generiert: gen D_männlich= männlich if männlich==1

Wenn ich reg lnw D_männlich in Stata eingebe, dann bekomme ich Kollinearität gemeldet.

Wie würdet Ihr den Effekt von männlich richtig ermitteln ?
Zuletzt geändert von Erich am Sa 15. Feb 2014, 18:06, insgesamt 1-mal geändert.
Erich
 
Beiträge: 3
Registriert: Mi 12. Feb 2014, 20:11
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression auf eine binäre Variable

Beitragvon daniel » Sa 15. Feb 2014, 16:44

Aber das Ergebnis ist doch verwaschen ? Weil die Löhne der Frauen mit eingeflossen sind ?


Was stellst Du Dir denn unter dem "Effekt von männlich" vor? Ein Effekt ist ein Unterschied. In diesem Fall der Unterschied zwischen Männern und Frauen. Wie willst Du einen Unterschied zwischen Gruppen schätzen, wenn Du zur Schätzung nur eine Gruppe (nämlich Männer) verwenden willst?

Du solltest in Einführungsbüchern zu Regresionsanalysen nachlesen, bevor Du anfängst Knöpfchen in Stata zu dücken. Anderenfalls ist das Risiko sehr hoch, dass Du Unsinn machst. Deine Grundeinstellung, die sich darin äußert hier nachzufragen, ist dazu schon mal ein sehr hilfreicher Anfang.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression auf eine binäre Variable

Beitragvon Erich » Sa 15. Feb 2014, 18:17

Hallo,

danke für die Antwort. Vielleicht habe ich das nicht richtig beschrieben.
Mit Effekt ist gemeint, ob "männlich" ( Ausprägungen 0 oder 1 im Datensatz) den logarithmierten Lohn erhöht ?
Es gibt ja diese Regressionsgleichung, oft habe ich sie gesehen: Y= Konstante+ Koeffizient* X + Fehlerterm.
X kann diskret sein, kontinuierlich, dichotom, usw. .
Wenn ich also nur reg lw male eingebe, meldet Stata Kollinearität. Wenn ich vorher dafür eine DV generiert habe.

Gebe ich reg lw male height language skill etc. ein, bekomme ich ein Ergebnis. Ich kann mir nicht herleiten, ob es stimmen
kann. Warum wird denn manchmal eine DV kreiert und manchmal nicht ?

Stata berechnet den Koeffizienten, der die entprechende Steigerung angibt ja für alle Personen. Wie kann man denn da
sagen, dass männlich den Lohn steigert. Es würde ja nicht für die Frauen gültig sein.
Erich
 
Beiträge: 3
Registriert: Mi 12. Feb 2014, 20:11
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression auf eine binäre Variable

Beitragvon mangel76 » Mo 17. Feb 2014, 18:55

Ich glaube die Definition deiner Dummy ist falsch.

gen D_männlich= männlich if männlich==1

Was hat denn männlich für Ausprägungen? Ich gehe mal davon aus, dass männlich nicht schon 0/1-kodiert ist, also etwa 1 für Männer und 2 für Frauen. Und was hat dann D_männlich für einen Wert falls männlich!=1? Dann müsste es missing sein, also verwendest du in deiner Regression nur Beobachtungen mit dem gleichen Wert für deine Dummy, ergo Kollinearität. Versuche mal

Code: Alles auswählen
gen D_männlich=männlich==1


Obiger Code wertet aus, ob die Aussage männlich==1 Falsch oder Richtig ist und setzt D_männlich entsprechend auf 0 oder 1.

Zur Interpretation: Der Koeffizient gibt dir Auskunft über den (relativen bei Logs) Unterschied in der abhängigen Variable (Lohn) zwischen Männern und Frauen gegeben alle anderen erklärenden Variablen, also height und language skill sind gleich. Umgangssprachlich etwa: Wieviel % verdient ein Mann mehr (oder weniger) als eine Frau gleicher Größe und mit gleichen sprachlichen Fähigkeiten.
mangel76
 
Beiträge: 39
Registriert: Do 9. Jan 2014, 16:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression auf eine binäre Variable

Beitragvon Erich » Mi 19. Feb 2014, 11:31

Eine Variable wie gender kann die Ausprägungen 1,2 haben. Die Variable male ist
ist entweder 0 oder 1.

Anscheinend kann man das Generieren von einer Dummyvariable nicht an eine Bedingung knüpfen.

Vielen Dank für den richigen Stata- Befehl und für die Hilfe.
Erich
 
Beiträge: 3
Registriert: Mi 12. Feb 2014, 20:11
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionsmodelle

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron