Regressionsanalyse- Ausreißer Umbennen/Löschen

Regressionsmodelle aller Art mit Stata.

Regressionsanalyse- Ausreißer Umbennen/Löschen

Beitragvon TobiasWQ » Mi 2. Sep 2020, 12:10

Hallo liebe Statistik- Freunde,
ich versuche mein Problem schnell auf den Punkt zubringen. Ich habe eine multiple lineare Regression zwischen dem Body-Mass-Index als AV, "fernsehdauer pro Minute", "anzahl der Tabakprodukte pro Tag "und "Alter des Befragten" als UV's, durchzuführen. Alles metrische Variablen, so weit so gut, dachte ich. Nun habe ich folgendes großes Problem. Bei allen der oben genannten Variablen, gibt es eine logische Reihenfolge der Merkmalsausprägung. Beispiel : 1 Zigarette rauchen 5 Personen pro Tag . 2 Zigaretten rauchen 10 personen pro Tag. Dies geht dann so weiter bis 50 Zigaretten. Und danach kommen 9999 Zigaretten für alle Befragten, die keine Angabe (!) gemacht haben. Bei Variable " Alter des befragten" genau das selbe. 9999 Jahre, für diejenigen, die keine Angabe gemacht haben .Damit ist aber leider die Modellannahme verletzt, dass es keine Ausreißer geben darf... Ich habe mir jetzt überlegt die Personen, die keine Angaben gemacht haben einfach aus dem Datensatz zu löschen, da sie an dem restlichen mittelwert sowieso nicht ändern (oder???). Das wäre bereits meine erste Frage. Wie Kann ich die Merkmalsausprägung , spricht "9999 Zigaretten - keine Angabe" löschen, ohne, dass ich die gesamte Variable lösche? Ich habe es bereits versucht mit. " drop, if ANZAHL DER GERAUCHTEN TABAKPRODUKTE > 60 " . Leider kein Erfolg. Ich bin total am verzweifeln. Ich würde mich über eure Lösungsvorschläge sehr freuen. Bei Bedarf kann ich gerne noch mehr informationen zur verfügung stellen. Vielen Dank im Voraus. :)
Ich möchte also das Label löschen, wenn es einen gewissen Wert übersteigt .
Nun habe ich auch bereits eingegeben "label drop BODY-MASS-INDEX, if = 9999" . habe ich hier was falsch gemacht? Außerdem erkennt er Die wörter Body Mass Index nicht, obwohl das als Label im Variablenmanager gelistet ist.


Da ich mir die metrischen Variablen aus dem Datensatz selber rausgesucht habe, ich aber theoretisch auch nominale Variablen zu Dummies machen könnte, bliebe das mein letzter Ausweg.
TobiasWQ
 
Beiträge: 2
Registriert: Mi 2. Sep 2020, 11:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regressionsanalyse- Ausreißer Umbennen/Löschen

Beitragvon TobiasWQ » Mi 2. Sep 2020, 14:12

Ich habe das Problem gelöst und man muss die missingvalues "definieren" (löschen/bereinigen). Das erreicht man mit folgendem Befehl : mvdecode var, mv (wert der wegsoll=.) -fertig.
TobiasWQ
 
Beiträge: 2
Registriert: Mi 2. Sep 2020, 11:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionsmodelle

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 6 Gäste

cron