Hallo,
für meine Datenanalyse muss ich erstmal meine Ausreißer beseitigen.
Dafür berechne ich pro Proband den Mittelwert und die Standardabweichung für zwei Variablen.
Konkret heißt das:
Berechne die Standardabweichung und den Mittelwert von v1 und v2, wenn Proband = 10011.
Meine Syntax dazu sieht so aus:
preserve
stack v1 v2 if proband ==10011, into(v3) clear
tabstat v3, statistics( mean sd ) columns(variables)
restore
Jetzt möchte ich, dass alle Daten gelöscht werden, die mehr als drei Standardabweichungen vom Mittelwert abweichen.
Kann ich das irgendwie mit einem Befehl machen?
Ich hätte es sonst halt für jeden Probanden einzeln ausgerechnet und dann per drop gelöscht.
Vielen Dank schonmal für eure Antworten und einen schönen Abend.