Ich hab da ein kleines Problem bei der Analyse für meine Masterarbeit, vielleicht kann mir ja jemand weiterhelfen...?
Analysieren möchte ich den Einfluss des Jahreseinkommens auf die Lebenszufriedenheit. Ich habe einen Panel Datensatz, im long Format für die Jahre 2005-2011.
Meine erklärende Variable, das aktuelle Einkommen, kommt aber nur alle 2 Jahre vor: 2005, 2007, 2009, 2011. Die abhängige Variable (= Lebenszufriedenheit) dafür jedes Jahr.
Mein Betreuer hat nun gesagt, ich soll auch eine Regression durchführen, welche nur die Jahre berücksichtigt in welchen meine abhängige Variable (aktuelles Einkommen) vorkommt. Also soll die Regression nur die Beobachtungen der Jahre 2005, 2007, 2009, 2011 enthalten.
Wie bekomme ich dies nun hin??
Ich habe zwei Ideen, weiss aber nicht welche korrekt ist bzw. besser geeignet:
1. ich füge in den Stata Syntax einfach ein „if“ ein, also zum Beispiel (Pseudo Code)
- Code: Alles auswählen
xtreg y x if (y05 == 1)
zur Info: y05 ist einer meiner Jahres Dummies (Indikatorvariable mit dem Wert „1“ für das Jahr 2005 und „0“ für alle anderen Jahre, entsprechend habe ich auch für alle anderen Jahre Indikatorvariablen).
Das Problem bei diesem Vorgehen ist, dass wenn ich mehrere Jahres Dummies einfüge (was ich ja muss), eine Fehlermeldung bekomme und der Syntax nicht funktioniert: zum Beispiel habe ich versucht
- Code: Alles auswählen
xtreg y x if (y05 == 1) & (y07 ==1)
kennt da jemand einen stata code mit dem das funktioniert?
2. Die andere Idee ist, dass ich meinen Datensatz verändere: Ich lösche alle Beobachtungen der Jahre raus die ich nicht brauche. Also enthält mein Datensatz dann nur noch Beobachtungen der Jahre 2005, 2007, 2009 und 2011 und führe dann einfach die Regression durch:
- Code: Alles auswählen
xtreg y x
Ein Problem das ich hier habe: Wie lösche ich die Beobachtungen der geraden Jahre (2006,2008,2010) aus dem Datensatz?
Für eure Hilfe oder Hinweise wäre ich euch echt dankbar!
viele Grüße