Hallo Zusammen
Ich hab da ein kleines Problem. Ich erklär es am besten mit meiner konkreten Fragestellung:
Ich habe ein balanciertes 4-Jahres Panel (2004-2008), im long format und möchte ich die Auswirkungen der Freizeitaktivitäten auf die Zufriedenheit mit der Work-Life Balance untersuchen.
Dabei möchte ich nur die erwerbstätigen Individuen berücksichtigen, also die arbeitslosen Personen aus den Analysen ausschliessen. Da ich nun aber ein Panel habe sind einige Personen in 2004 arbeitslos und z.B in 2005 erwerbstätig.
Eigentlich wollte ich alle Personen aus dem Panel werfen wenn diese arbeitslos sind (drop if….) aber dann schmeisse ich ja auch die raus die irgendwann in den 4 Jahren arbeitslos waren aber danach oder davor erwerbstätig sind. Das kann doch nicht korrekt sein? (da verliere ich doch zuviele Infos und Personen)
Meine Idee ist nun, den Erwerbsstatus in den Jahren in denen eine Personen arbeitslos ist auf missing zu setzten. Also die Ausprägung “arbeitslos“ der Variable Erwerbsstatus in ein missing umwandeln, was in Stata ja ein Punkt ist “.“
und dann die Schätzung durchzuführen (z.B. xtreg y x1 x2 x3 oder auch xtreg y x1 x2 x3, be).
Diese Person würde in den Jahren mit einem “missing“ dann doch automatisch in den Schätzungen nicht berücksichtigt werden, die Jahre in denen die gleichen Person dann aber erwerbstätig sind, dann aber schon in die Analyse miteinbezogen werden. oder?
Ich glaube meine zweite Idee mit den “missings“ ist korrekt, bin mir aber eben nicht sicher….??
Kann mir da jemand weiterhelfen
Grüße euch!