Ich will den Sales-Wachstum von unterschiedlichen Firmen-Gruppen in unterschiedlichen Jahren kalkulieren. Die Firmen sind gruppiert durch die Variablen:
- Code: Alles auswählen
country
- Code: Alles auswählen
industry
cross-post: http://stackoverflow.com/questions/1774 ... 9_17748340
Anbei habe ich ein Beispiel angehängt um das Problem zu beschreiben. Mein Datensatz enthält ca. 10.000 Firmen über 10 Jahren.
Ich summierte die sales je nach Gruppe mit identischen Variablen:
- Code: Alles auswählen
country industry year
- Code: Alles auswählen
bysort country year industry: egen sales_total = sum(sales)
und gruppierte jede Kombination:
- Code: Alles auswählen
egen group = group(year country industry)
Ich habe verschiedene Kombinationen schon ausprobiert:
- Code: Alles auswählen
egen group = group(year country industry)
xtset group year, yearly
bys group: g salesgrowth = log(D.sales_total)
oder
- Code: Alles auswählen
egen group = group(year country industry)
xtset group year, yearly
bysort group: gen salesgrowth=(sales_total[_n]-sales_total[_n-1])/sales_total[_n-1]
Bekomme aber immer den Fehler:
repeated time values within panel
aufgrund der Wiederholung der Gruppen-Nummer in Group-Variable.
Das Hauptproblem liegt darin, dass ich gerne die restlichen Variablen und Observationen behalten will. Ich hatte nämlich schon eine potenzielle Lösung mit
- Code: Alles auswählen
collapse
- Code: Alles auswählen
collapse (sum) sales, by(country year industry)
egen group1 = group(industry country)
drop if missing(industry)
drop if missing(country)
xtset group1 year
bysort group1: gen sales_growth = (sales[_n]-sales[_n-1])/sales[_n-1]
Aber ich habe mehrere
- Code: Alles auswählen
industry
- Code: Alles auswählen
collapse
je Land(country):
Wachstum(von industry x) - Wachstum(von allen Firmen in einem Land)
Ich hoffe ich habe mein Problem so gut wie möglich geschildert. Auch wenn es viel Text ist hoffe ich, dass ihr mir helfen könnt. Wäre toll. Vielen Dank, Franz.