Hallo zusammen,
Ich habe einen Datensatz, der verkürzt folgendermaßen aussieht:
Land Branche Beruf Jahr Lohn
Arg MA 1 1992 44777
Arg MA 1 1993 33555
Arg MA 1 1993 45554
Arg MA 2 1992 2000
Arg MA 2 1993 2332
Arg LA 4 1993 11122
Aus Ma 1 1992 9887
... ... ... ...
usw.
Ich habe also die Daten von unterscheidlichen Berufen in unterscheidlichen Branchen und unterschiedlichen Ländern, für die Jahre im Zeitraum von 1993 bis 1999.
Ich würde nun gerne zuerst für jeden Beruf einen Durchschnittswert der Löhne über die Jahre berechnen. Mit diesem Durchschnittswert will ich für jedes Land den Medianlohn berechnen.
Bisher weiß ich nur, wie ich allgemein den Median für ein Land bekomme, aber ohne vorher die Durchschnittswerte der Berufe über die Jahre zu berechnen.
Wenn ich eine neue Spalte mit einer neuen Variablen nur mit den Durchschnittswerten generiere, steht diser Wert in jeder Zeile, d.h. ich kann diese Spalte nicht verwenden, um den Median zu berechnen.
Weiß jemand, wie ich dieses Problem lösen kann?
Vielen Dank im Vorraus für die Hilfe!