Hallo,
ich schreibe gerade meine Bachelorarbeit zum Thema Gender Pay Gap und führe eine empirische Studie zu diesem Thema durch. Für die Analyse verwende ich Stata 17 und einen SOEP-Datensatz (genauer gesagt den SOEP core v36eu $pequiv).
Da ich nur einen GPG für das Jahr 2018 berechne, habe ich zunächst nur die Daten für 2018 herausgefiltert.
Nun möchte ich die Einkommensvariable verwenden, um den Effekt des Geschlechts mit einer einfachen bivariaten linearen Regression zu berechnen (den unbereinigten GPG).
Der Datensatz enthält nur das Jahreseinkommen (sowohl Einzel- als auch Haushaltseinkommen) als Variablen. Meine Frage ist nun, wie ich diese in einen Stundenlohn umwandeln kann.
Ich möchte dann die Variable "Stundenlohn" logarithmieren und sie als abhängige Variable verwenden.
Das Codebuch für den Datensatz ist hier: https://www.diw.de/de/diw_01.c.809654.d ... _soep.html
Die Einkommensvariablen, die ich verwenden möchte, heißen i11110 und i11103
Außerdem hatte ich mich gefragt, wie ich anschließend richtig gewichten kann. Im Datensatz gibt es nämlich eine Menge Gewichtungsvariablen, und jetzt bin ich ein bisschen überfordert, welche ich wie verwenden soll (die Gewichtungsvariablen sind von W11101 bis W11111).
Ich denke, der Code könnte etwa so aussehen: reg ln_individual income i.gender [iweight = w11101], r
Was meint ihr dazu?
Könnt ihr mir helfen?
Mit freundlichen Grüßen,
Dario Nitschke