Auf FE Regression komme ich nur weil meine Betreuerin meinte ich solle doch damit regressieren. (ich kenne mich leider nur wenig mit den versch. Regressionsformen etc. aus)
Das ist m.E. ein massives Problem. Es gibt sehr gute Gründe für ein FE Modell. Das ist keine "Geschmacksfrage" oder Konvention. Wenn Dein outcome von Charakteristika der Firmen abhängt, die nicht kontrolliert werden, dann führt die Verwendung anderer Methoden zu verzerrten Schätzern. Mit Deinem Vorschlag ist ein FE Modell aus genannten Gründen nicht möglich. Es ist schön, dass Du pro Jahr tausensde Firmendaten hast, aber die Unterschiede zwischen den Firmen werden bei der FE Regression nicht verwendet. Pro Jahr und Firma gibt es nur einen Datenpunkt. Was Du hier tust, ist sozusagen das statistische "Gegenteil" der FE Regression, nämliche eine sogn. between regression, in der alle Unterschiede innrhalb einer Firma über die Zeit ignoriert werden und lediglich die Unterschiede zwischen Firmen in verschiedenen Jahren zur Schätzung der Koeffizienten verwendet werden. Wie erwähnt wird dann dem Cash-flow möglicherweise ein "Effekt" zugeschrieben, der schlicht auf unbeobachteten Unterschieden zwischen Firmen beruht.
Vielleicht solltest Du Dein Vorgehen nochmal mit Deiner Betreuerin abstimmen?
Wie das Problem technisch gelöst werden könnte, habe ich in meiner ersten Antwort angedeutet. Pseudocode
- Code: Alles auswählen
statsby _b[<cashflow>] ,by(<year>) : reg <y> <x> <cashflow> if (<XYZ> == 1),vce(robust)
wobei alle Elemente in < und > durch die entsprechenden Variablennamen ausgetauscht, und Daten im "langen" Format vorrausgesetzt werden.
Ich wiederhole, dass ich es nicht sinnvoll finde "irgendetwas" zu tippen, ohen zu verstehen, was genau ich warum tue.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.