Analyse nur für bestmmte Jahre

Statistische Auswertung von Longitudinal- und Panel-Daten mit Stata.

Analyse nur für bestmmte Jahre

Beitragvon Dennis_m » Do 22. Mai 2014, 11:01

Hallo zusammen

Ich hab da ein kleines Problem bei der Analyse für meine Masterarbeit, vielleicht kann mir ja jemand weiterhelfen...?

Analysieren möchte ich den Einfluss des Jahreseinkommens auf die Lebenszufriedenheit. Ich habe einen Panel Datensatz, im long Format für die Jahre 2005-2011.
Meine erklärende Variable, das aktuelle Einkommen, kommt aber nur alle 2 Jahre vor: 2005, 2007, 2009, 2011. Die abhängige Variable (= Lebenszufriedenheit) dafür jedes Jahr.

Mein Betreuer hat nun gesagt, ich soll auch eine Regression durchführen, welche nur die Jahre berücksichtigt in welchen meine abhängige Variable (aktuelles Einkommen) vorkommt. Also soll die Regression nur die Beobachtungen der Jahre 2005, 2007, 2009, 2011 enthalten.

Wie bekomme ich dies nun hin??

Ich habe zwei Ideen, weiss aber nicht welche korrekt ist bzw. besser geeignet:

1. ich füge in den Stata Syntax einfach ein „if“ ein, also zum Beispiel (Pseudo Code)
Code: Alles auswählen
xtreg y x if (y05 == 1)

zur Info: y05 ist einer meiner Jahres Dummies (Indikatorvariable mit dem Wert „1“ für das Jahr 2005 und „0“ für alle anderen Jahre, entsprechend habe ich auch für alle anderen Jahre Indikatorvariablen).
Das Problem bei diesem Vorgehen ist, dass wenn ich mehrere Jahres Dummies einfüge (was ich ja muss), eine Fehlermeldung bekomme und der Syntax nicht funktioniert: zum Beispiel habe ich versucht
Code: Alles auswählen
xtreg y x if (y05 == 1) & (y07 ==1)

kennt da jemand einen stata code mit dem das funktioniert?

2. Die andere Idee ist, dass ich meinen Datensatz verändere: Ich lösche alle Beobachtungen der Jahre raus die ich nicht brauche. Also enthält mein Datensatz dann nur noch Beobachtungen der Jahre 2005, 2007, 2009 und 2011 und führe dann einfach die Regression durch:
Code: Alles auswählen
xtreg y x

Ein Problem das ich hier habe: Wie lösche ich die Beobachtungen der geraden Jahre (2006,2008,2010) aus dem Datensatz?


Für eure Hilfe oder Hinweise wäre ich euch echt dankbar!
viele Grüße
Dennis_m
 
Beiträge: 5
Registriert: Sa 11. Jan 2014, 00:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Analyse nur für bestmmte Jahre

Beitragvon daniel » Do 22. Mai 2014, 14:55

Ich hab das nur ganz grob überflogen, aber wenn y05 ein Indikator ist, der 1 ist, wenn das Jahr 2005 ist, 0 sonst, dann kann Deine Bedingung (y05 == 1) & (y07 == 1) unmöglich wahr sein, denn es ist entweder das jahr 05 oder 07, aber nicht beides gleichzeitig.

Ersetze das & durch | (oder).
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Analyse nur für bestmmte Jahre

Beitragvon Dennis_m » Do 22. Mai 2014, 16:52

Erstmal Danke für die rasche Antwort!!!!

….ohh man!! :shock: natürlich, das muss natürlich ein „oder“ bzw. ein “|“ sein

Ich bekomme nun auch keine Fehlermeldung mehr sondern einen regressions-output!!
Vielen vielen Dank!!

Ist es denn mit einem „oder“ korrekt? Also beziehen sich dann die Analysen (bzw. diese Regression) nur auf die beiden Jahre? Das heisst, wenn ich mehrere Jahres Dummies berücksichtige - zusätzlich noch y09 für 2009 und y11 für 2011:
Code: Alles auswählen
regress y x if (y05==1) | (y07 ==1) | (y09==1) | (y11==1)

bezieht sich die Analyse nur auf Beobachtung der Jahre 2005, 2007, 2009 und 2011

ist diese Schlussfolgerung korrekt?

schöne Grüße
Dennis_m
 
Beiträge: 5
Registriert: Sa 11. Jan 2014, 00:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Analyse nur für bestmmte Jahre

Beitragvon daniel » Do 22. Mai 2014, 22:30

Ja. Schau Dir die -inlist()- Funktion als elegantere Alternative zur Aufreihung multipler "oder-Struckturen".
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Analyse nur für bestmmte Jahre

Beitragvon Dennis_m » Fr 23. Mai 2014, 17:07

Hi Daniel

erstmal vielen Dank für deine Antworten!!!

Code: Alles auswählen
regress y x if inlist(1, y05, y07, y09, y11)

ist viel eleganter. Nach ausgiebiger Recherche zu "inlist" hat es nun auch funktioniert. sehr cool!! vielen Dank!!

Noch eine Frage: obwohl ich mit dem obigen Syntax nun die Regression auf die Jahre 2005,2007, 2009 und 2011 eingegrenzt habe, würde ich gerne einen Datensatz erstellen der nur die Variablen aus meinen benötigten jahren enthält. Würde es dann auch funktionieren wenn ich einfach die Beobachtungen aus den Jahren die ich nicht brauche rauslöschen würde.
konkret: mit meinen Jahres Dummies dann einfach alle Beobachtungen z.B. für 2002 löschen:
Code: Alles auswählen
drop if y02=1
entsprechend für die anderen Jahre.

geht das auch oder ist darf man das aus ökonometrischer Sichtweise nicht machen?

schöne Grüße
Dennis_m
 
Beiträge: 5
Registriert: Sa 11. Jan 2014, 00:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Analyse nur für bestmmte Jahre

Beitragvon daniel » Sa 24. Mai 2014, 14:24

Das Ergebnis ist das selbe. Je nachdem, ob Du die Daten noch für andere Zwecke (Analysen, Imputation ...) benötigst, ist das Löschen am Ende mehr Aufwand.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Analyse nur für bestmmte Jahre

Beitragvon Dennis_m » Sa 24. Mai 2014, 21:02

Hi Daniel

....ja das mit dem Imputieren hat mein Betreuer auch schon am Rande angesprochen....klar dann machts natürlich mehr arbeit....

vielen vielen Danke für deine Antworten!!! hat echt geholfen & Klarheit geschaft!!

viele Grüße
Dennis_m
 
Beiträge: 5
Registriert: Sa 11. Jan 2014, 00:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Longitudianal und Panel-Analyse

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron