Panel Daten - missing oder nicht?

Statistische Auswertung von Longitudinal- und Panel-Daten mit Stata.

Panel Daten - missing oder nicht?

Beitragvon Victoria » Fr 7. Mär 2014, 19:35

Hallo Zusammen

Ich hab da ein kleines Problem. Ich erklär es am besten mit meiner konkreten Fragestellung:

Ich habe ein balanciertes 4-Jahres Panel (2004-2008), im long format und möchte ich die Auswirkungen der Freizeitaktivitäten auf die Zufriedenheit mit der Work-Life Balance untersuchen.
Dabei möchte ich nur die erwerbstätigen Individuen berücksichtigen, also die arbeitslosen Personen aus den Analysen ausschliessen. Da ich nun aber ein Panel habe sind einige Personen in 2004 arbeitslos und z.B in 2005 erwerbstätig.

Eigentlich wollte ich alle Personen aus dem Panel werfen wenn diese arbeitslos sind (drop if….) aber dann schmeisse ich ja auch die raus die irgendwann in den 4 Jahren arbeitslos waren aber danach oder davor erwerbstätig sind. Das kann doch nicht korrekt sein? (da verliere ich doch zuviele Infos und Personen)

Meine Idee ist nun, den Erwerbsstatus in den Jahren in denen eine Personen arbeitslos ist auf missing zu setzten. Also die Ausprägung “arbeitslos“ der Variable Erwerbsstatus in ein missing umwandeln, was in Stata ja ein Punkt ist “.“
und dann die Schätzung durchzuführen (z.B. xtreg y x1 x2 x3 oder auch xtreg y x1 x2 x3, be).

Diese Person würde in den Jahren mit einem “missing“ dann doch automatisch in den Schätzungen nicht berücksichtigt werden, die Jahre in denen die gleichen Person dann aber erwerbstätig sind, dann aber schon in die Analyse miteinbezogen werden. oder?

Ich glaube meine zweite Idee mit den “missings“ ist korrekt, bin mir aber eben nicht sicher….??
Kann mir da jemand weiterhelfen

Grüße euch!
Victoria
 
Beiträge: 4
Registriert: So 14. Jul 2013, 17:41
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Panel Daten - missing oder nicht?

Beitragvon daniel » Sa 8. Mär 2014, 18:17

Wieso fügst Du nicht einfach eine Indikatorvariable ins Modell ein und kontrollierst für den Erwersstatus?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Panel Daten - missing oder nicht?

Beitragvon Victoria » So 9. Mär 2014, 12:15

Hi Daniel

Vielen Dank....daran habe ich noch gar nicht gedacht…! Das wäre echt eine elegante Lösung!!

Du meinst also einen Dummy-Variable welche den Wert 1 hat wenn die Person erwerbstätig ist und 0 wenn die Person nicht erwerbstätig ist.
Aber wenn ich diese Indikatorvariable als Kontrollvariable drin habe, entsteht dann nicht das Problem, dass diese Variable den Wert und das Signifikanzniveau der anderen geschätzten Koeffizienten beeinflusst? Und das auch dann, wenn der geschätzte Koeffizient dieser Indikatorvariable nicht signifikant ist, oder?

(also bzgl. des Beispiels, dass diese Indikatorvariable den Einfluss der Freizeitaktivitäten (meine erklärenden Variable) auf die Zufriedenheit mit der Work-Life Balance (abhängige Variable) verzerrt -und eben auch dann wenn diese Indikatorvariable nicht signifikant ist)

Oder sehe ich das falsch?

viele Grüße!
Victoria
 
Beiträge: 4
Registriert: So 14. Jul 2013, 17:41
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Panel Daten - missing oder nicht?

Beitragvon daniel » So 9. Mär 2014, 14:48

Aber wenn ich diese Indikatorvariable als Kontrollvariable drin habe, entsteht dann nicht das Problem, dass diese Variable den Wert und das Signifikanzniveau der anderen geschätzten Koeffizienten beeinflusst? Und das auch dann, wenn der geschätzte Koeffizient dieser Indikatorvariable nicht signifikant ist, oder?


Ich verstehe nicht wessahlb das ein "Problem" sein sollte. Die anderen Koeffizienten spiegeln dann den jeweiligen Effekt unter Konstrolle des Erwerbstatus wider. In der Regel ist das gewünscht, kommt aber natürlich auf die exakte theoretisch interessierende Forschungsfrage und die exakten Hypothesen an.

(also bzgl. des Beispiels, dass diese Indikatorvariable den Einfluss der Freizeitaktivitäten (meine erklärenden Variable) auf die Zufriedenheit mit der Work-Life Balance (abhängige Variable) verzerrt -und eben auch dann wenn diese Indikatorvariable nicht signifikant ist)


Ich weiß auch nicht, was Du hier mit "verzerrt" meinst. Verzerrt bedeutet in der Statisitk i.d.R. nicht erwartungstreu bzw. inkonsitent. Wesshalb der Effekt der Freizeitaktivität inkonsitent geschätzt werden soll, wenn Du für den Erwerbsstatus kontrollierst ist mir unklar.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Panel Daten - missing oder nicht?

Beitragvon Victoria » Mo 10. Mär 2014, 09:46

Hallo Daniel

vielen Dank!!

diesbezüglich:
daniel hat geschrieben:Ich weiß auch nicht, was Du hier mit "verzerrt" meinst. Verzerrt bedeutet in der Statisitk i.d.R. nicht erwartungstreu bzw. inkonsitent. Wesshalb der Effekt der Freizeitaktivität inkonsitent geschätzt werden soll, wenn Du für den Erwerbsstatus kontrollierst ist mir unklar.

hab ich alltagssprachlich formuliert...du hast natürlich recht, die sind dann natürlich nicht verzerrt!! :)


daniel hat geschrieben:Ich verstehe nicht wessahlb das ein "Problem" sein sollte. Die anderen Koeffizienten spiegeln dann den jeweiligen Effekt unter Konstrolle des Erwerbstatus wider. In der Regel ist das gewünscht, kommt aber natürlich auf die exakte theoretisch interessierende Forschungsfrage und die exakten Hypothesen an.

Ja und damit triffst du genau ins Schwarze:
Meine Hypothesen sind genau so formuliert, dass die Auswertungen und Schätzverfahren nur für erwerbstätige Personen durchgeführt werden sollen. Personen welche arbeitslos sind sollen aus dem Sample ausgeschlossen werden.
Deshalb bin ich auf der Suche nach einer Möglichkeit wie ich eben die Personen ausschliessen kann die Arbeitslos sind bzw. diejenigen Jahre ausschliessen kann, in denen eine Person arbeitslos war. (Da ich ja Personen in meinem Panel habe die in z.B. in 2004 arbeitslos und ab 2005 wieder erwerbstätig sind - in einem solchen Fall würde ich gerne einfach die Person für das Jahr
2004 nicht in den Schätzungen berücksichtigen aber ab 2005 natürlich wieder reinnehmen).

Zur Info: Arbeitslose Personen sollen deshalb aus der Analyse bzw. dem Sample ausgeschlossen werden, da die theoretischen Modelle welche ich meinen Hypothesen zugrunde gelegt habe nur auf erwerbstätige Beschäftigte angewendet werden können bzw. die theoretischen Modelle nur für Erwerbstätige gelten. Folglich habe ich auch meine theoretische Fragestellung und Hypothesen so formuliert.

schöne Grüße!
Victoria
 
Beiträge: 4
Registriert: So 14. Jul 2013, 17:41
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Panel Daten - missing oder nicht?

Beitragvon daniel » Mo 10. Mär 2014, 10:55

Deshalb bin ich auf der Suche nach einer Möglichkeit wie ich eben die Personen ausschliessen kann die Arbeitslos sind bzw. diejenigen Jahre ausschliessen kann, in denen eine Person arbeitslos war.


Das sind zwei theoretisch sehr unterschiedliche Dinge und Du solltest wissen, welches von beiden Du möchtest. Ich würde in jedem Fall für die Dauer der aktuellen Berufstätigkeit kontrollieren.

Die technische Umsetzung scheint dann doch eher sehr einfach zu sein. Wie Du alle Personen aussschließt, die irgendwann arbeitslos waren, scheinst Du bereits wissen. Willst Du nur die Jahre por Person behalten, in denen keine Arbeitslosikkeit vorliegt, sollte ein einfacher -if- qualifier genügen. Pseudo-code etwa

Code: Alles auswählen
xtreg y x if (Arbeitslosikkeit == 0)


btw.
und dann die Schätzung durchzuführen (z.B. xtreg y x1 x2 x3 oder auch xtreg y x1 x2 x3, be).


Wieso das Potential der Daten verschenken und pooled OLS schätzen, oder schlimmer noch, nur die between Varianz verwenden. Der Vorteil von Paneldaten besteht in der Möglichkeit mittels fixed-effects (-fe- option) Modellen zeitkonstante unbeobchtete Heterogenität zu kontrollieren.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Panel Daten - missing oder nicht?

Beitragvon Victoria » Mo 10. Mär 2014, 17:26

Hallo Daniel

ok, alles klar :)

Ich werde sowohl für die Dauer der Berufstätigkeit kontrollieren! Ja und der Tipp mit dem fixed effects (musste ich zwar erst etwas nachlesen und recherchieren) aber auch das werde ich anwenden!!


Vielen Vielen Dank für deine vielen schnellen Antworten und Inputs!!! - die sind echt klasse!!!
schöne Grüße!
Victoria
 
Beiträge: 4
Registriert: So 14. Jul 2013, 17:41
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Longitudianal und Panel-Analyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron