GPG lin reg, Jahreseinkommen in Stundeneinkommen, gewichten

Regressionsmodelle aller Art mit Stata.

GPG lin reg, Jahreseinkommen in Stundeneinkommen, gewichten

Beitragvon darionitschke1998 » Sa 27. Aug 2022, 12:28

Hallo,
ich schreibe gerade meine Bachelorarbeit zum Thema Gender Pay Gap und führe eine empirische Studie zu diesem Thema durch. Für die Analyse verwende ich Stata 17 und einen SOEP-Datensatz (genauer gesagt den SOEP core v36eu $pequiv).

Da ich nur einen GPG für das Jahr 2018 berechne, habe ich zunächst nur die Daten für 2018 herausgefiltert.
Nun möchte ich die Einkommensvariable verwenden, um den Effekt des Geschlechts mit einer einfachen bivariaten linearen Regression zu berechnen (den unbereinigten GPG).
Der Datensatz enthält nur das Jahreseinkommen (sowohl Einzel- als auch Haushaltseinkommen) als Variablen. Meine Frage ist nun, wie ich diese in einen Stundenlohn umwandeln kann.
Ich möchte dann die Variable "Stundenlohn" logarithmieren und sie als abhängige Variable verwenden.
Das Codebuch für den Datensatz ist hier: https://www.diw.de/de/diw_01.c.809654.d ... _soep.html
Die Einkommensvariablen, die ich verwenden möchte, heißen i11110 und i11103

Außerdem hatte ich mich gefragt, wie ich anschließend richtig gewichten kann. Im Datensatz gibt es nämlich eine Menge Gewichtungsvariablen, und jetzt bin ich ein bisschen überfordert, welche ich wie verwenden soll (die Gewichtungsvariablen sind von W11101 bis W11111).

Ich denke, der Code könnte etwa so aussehen: reg ln_individual income i.gender [iweight = w11101], r


Was meint ihr dazu?
Könnt ihr mir helfen?
Mit freundlichen Grüßen,

Dario Nitschke
darionitschke1998
 
Beiträge: 4
Registriert: Fr 26. Aug 2022, 13:35
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: GPG lin reg, Jahreseinkommen in Stundeneinkommen, gewich

Beitragvon Staxa » Sa 27. Aug 2022, 18:12

Das sehe ich eher nicht als Stata Fragen sondern eher als SOEP Fragen. Besonders bei den Gewichten steckt der Teufel oft im Detail, hier kann nur ein Blick in die entsprechenden Dokumente helfen, welche Variable für dich die beste ist. Im Prinzip musst du für den Stundenlohn nur das Einkommen und die gearbeiteten Stunden heraussuchen und dann berechnen.

Im Prinzip ist deine Regression richtig (achtung, Varnames haben niemals Leerzeichen), aber auch etwas naiv. Du berücksichtigst zum Beispiel nicht, in welchen Berufsfeldern Personen arbeiten usw... hier wird der Blick in die Literatur helfen zu sehen, was man hier am besten wie berechnet. Das Thema ist nicht einfach und man kann fix bei sehr falschen Schlussfolgerungen landen.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 685
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: GPG lin reg, Jahreseinkommen in Stundeneinkommen, gewich

Beitragvon darionitschke1998 » Mi 31. Aug 2022, 14:39

Hallo, danke für die Antwort.
Zum Berechnen des log Stundenlohns wurde mir nun folgender Code vorgeschlagen:
gen logstdlohn = ln(jahreseinkommen/jahresarbeitszeit)
Das funktioniert und darauf wollte ich hinaus.

Die beschriebene Regression war nur ein Beispiel für den unbereinigten GPG. Dieser berücksichtigt noch keine Unterschiede in lohnrelevanten Merkmalen. Der bereinigte GPG führt dann die angesprochenen wichtigen Drittvariablenkontrollen ein und schaut nach lohnrelevanten Merkmalen etc. Darauf liegt auch der Fokus der BA-Arbeit.

Zur Gewichtung verwende ich jetzt: [pweight = w11105]
Dabei handelt es sich um die "individuals cross-sectional weight"-Variable (siehe Codebook).

Besten Dank!
darionitschke1998
 
Beiträge: 4
Registriert: Fr 26. Aug 2022, 13:35
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionsmodelle

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron