Werte einer Variable aggregieren?

Fragen zu Stata Syntax und Do-Files.

Werte einer Variable aggregieren?

Beitragvon pezet » Do 28. Aug 2014, 20:18

Hallo Statarer!

Ich wende mich an euch in der Hoffnung, mich aus einer der zahllosen Untiefen meiner Masterarbeit herauszuführen.

Ich habe folgendes Problem:
Ich arbeite mit einem Datensatz, welcher Informationen zu einer Vielzahl von Unternehmen enthält. Eine Variable erfasst dabei sehr detailliert die Sektorzugehörigkeit, abgebildet als vierstelligen Code. Da dies für meine Zwecke viel zu ausführlich ist, würde ich gerne zusammengehörige Werte innerhalb dieser Variable zu einem neuen Wert aggregieren.

Beispiel:
Unternehmen 1 hat den Sektorcode 0112, baut also Obst an. Unternehmen 2 hat den Code 0113, baut demnach Gemüse an. Da es für meine Zwecke ausreicht, dass beide im Sektor Landwirtschaft tätig sind, würde ich gerne die Werte/Ausprägungen so aggregieren, dass bei beiden Unternehmen in der Variable Sektorcode (oder auch gerne in einer neuen Variable, ist egal) der Wert "Landwirtschaft" (von mir aus auch ein numerischer Wert) erscheint.
Die Werte einzeln/händisch zu ändern, kommt leider nicht in Frage, da das dataset sehr groß ist (ca. 85.000 Unternehmen).

Wie kann ich das erreichen? Habe versucht, mich bei google kundig zu machen, dort aber außer dem Befehl gen bzw. replace nichts gefunden. gen/replace bringt mir auch nichts, da somit ja für jeden "aggregierten Sektor" eine eigene Variable notwendig wäre.
Ich hoffe jemand kann mir weiterhelfen und danke schonmal im Voraus!

Schöne Grüße,
Pawel
pezet
 
Beiträge: 1
Registriert: Do 28. Aug 2014, 19:52
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Werte einer Variable aggregieren?

Beitragvon mangel76 » Fr 29. Aug 2014, 12:06

Hallo Pawel,

ist es denn immer so, dass du eigentlich nur den 4-Steller auf 2- oder 3-Steller zusammenfassen willst? Dann lässt es sich recht einfach bewerkstelligen:
Code: Alles auswählen
generate sector2=int(sector/10)

die Variable sector2 ist dann nur noch auf 3-Steller-Ebene.

Sollte es nicht so einfach sein, kommst du wohl um ein "recode" nicht herum. Alternativ könntest du eine Liste erstellen mit der Zuordnung der Sektorkennzahl und der Gruppennummer und diese Liste dann an deinen Datensatz anspielen mit "merge".

Viele Grüße
mangel76
mangel76
 
Beiträge: 39
Registriert: Do 9. Jan 2014, 16:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Stata Syntax

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste

cron