Hallo!
In meinem Datensatz habe ich verschiedene Wirkstoffgruppen gegeben, den Namen der Firma für jedes Medikament und das Quartal.
In jeder Wirkstoffgruppe gibt es mehrere Medikamente, die zu dieser Gruppe gehören, und die auch von verschiedenen Firmen hergestellt werden. Ein Beispiel:
Wirkstoff: Quartal: Firma:
Verapamil 9 RATIO
Verapamil 9 WINTHROP
Verapamil 9 TAD
Verapamil 9 RATIO
Verapamil 9 RATIO
Verapamil 10 AWD
Verapamil 10 DEXCEL
Verapamil 10 1A PHARMA
Verapamil 10 HEUMANN
Ich möchte nun eine Variable generieren, die mir die Anzahl Firmen in einer Wirkstoffgruppe PRO QUARTAL wiedergibt. Firmen kommen pro Gruppe mehrmals vor (wie da z. B: RATIO), da sie dann mehrere Medikamente mit dem Wirkstoff herstellen. RATIO soll jedoch hier nur EINMAL gezählt werden.
In diesem Beispiel sollten also für Quartal 9 und Wirkstoff Verapamil von der zu generierenden Variable die Anzahl 3 wiedergegeben werden, da drei verschiedene Firmen.
Für Quartal 10 die Anzahl 4, da vier verschiedene Firmen.
Ich habe mal den Befehl "by wirkstoff: tabulate firma" eingegeben, da wird jedoch dann nur die Gesamtzahl aller Beobachtungen für sortiert nach Firmenname wiedergegeben über alle Quartale hinweg.
Das Problem ist auch, dass dieser count Befehl immer nur die Anzahl für eine oder mehrere Ausprägung angeben kann. Jedoch bräuchte einen Befehl, der mir die Anzahl VERSCHIEDENER vorhandener Ausprägungen wiedergibt.
Ich habe so viel herumprobiert! Ich komme einfach nicht weiter!