Hallo Statarer!
Ich wende mich an euch in der Hoffnung, mich aus einer der zahllosen Untiefen meiner Masterarbeit herauszuführen.
Ich habe folgendes Problem:
Ich arbeite mit einem Datensatz, welcher Informationen zu einer Vielzahl von Unternehmen enthält. Eine Variable erfasst dabei sehr detailliert die Sektorzugehörigkeit, abgebildet als vierstelligen Code. Da dies für meine Zwecke viel zu ausführlich ist, würde ich gerne zusammengehörige Werte innerhalb dieser Variable zu einem neuen Wert aggregieren.
Beispiel:
Unternehmen 1 hat den Sektorcode 0112, baut also Obst an. Unternehmen 2 hat den Code 0113, baut demnach Gemüse an. Da es für meine Zwecke ausreicht, dass beide im Sektor Landwirtschaft tätig sind, würde ich gerne die Werte/Ausprägungen so aggregieren, dass bei beiden Unternehmen in der Variable Sektorcode (oder auch gerne in einer neuen Variable, ist egal) der Wert "Landwirtschaft" (von mir aus auch ein numerischer Wert) erscheint.
Die Werte einzeln/händisch zu ändern, kommt leider nicht in Frage, da das dataset sehr groß ist (ca. 85.000 Unternehmen).
Wie kann ich das erreichen? Habe versucht, mich bei google kundig zu machen, dort aber außer dem Befehl gen bzw. replace nichts gefunden. gen/replace bringt mir auch nichts, da somit ja für jeden "aggregierten Sektor" eine eigene Variable notwendig wäre.
Ich hoffe jemand kann mir weiterhelfen und danke schonmal im Voraus!
Schöne Grüße,
Pawel