Umgang mit Missings

Allgemeine Fragen rund um Statistik mit Stata.

Umgang mit Missings

Beitragvon Lenni » Sa 25. Mai 2019, 12:47

Hallo zusammen,
ich habe eine grundsätzliche Frage zum Umgang mit Missings und hoffe ihr könnt mir dazu vielleicht ein paar Tipps geben.
Ich habe in meinem Datensatz viele Variablen aus denen ich eine neue Variable generieren muss. Bspw. besteht die Variable Studieninteresse oder Perfektionismus aus mehrere Items, aus denen ich einen mean score bilde. Leider habe ich auch einige Missings bei diesen Items. Folge natürlich, dort wo ein Missing ist wird auch kein mean score für meine Variablen gebildet. Somit habe ich ganz unterschiedliche Beobachtungen (N) für meine verschiedenen Variablen. Bei den meisten Studien, die ich gelesen habe, ist das N bei den verschiedenen Variablen meistens gleich. Daher bin ich etwas verunsichert, wie ich damit nun umgehen soll.
Alle Beobachtungen zu löschen, bei denen Missings vorkommen, ist allerdings problematisch, da ich sonst einen sehr großen Datenverlust hätte.

1. Wie gehe ich am besten damit um, bzw. was sollte ich bei der Analyse beachten (z.B. deskriptive Statistiken) oder kann ich die unterschiedlichen N einfach so hinnehmen?
2. Seht ihr es als kritisch, ein Item der Skala (bei dem besonders viele Missings auftreten) bei der Berechnung des mean score rauszulassen? (Reliabilität würde sich nur geringfügig <0,01 verändern)?
3. ist es richtig, dass bei der Korrelations-/Regressionsanalyse Missings keine Rolle spielen, da sie in die Analyse sowieso nicht mit eingehen? Aber verzerren Missings die Schätzung trotzdem?

Vielen Dank schonmal vorab. Ich würde mich sehr freuen, wenn mir jemand helfen kann.
LG
Lenni
 
Beiträge: 7
Registriert: Di 14. Mai 2019, 20:22
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Umgang mit Missings

Beitragvon Staxa » Di 28. Mai 2019, 13:49

Missings sind immer ein großes Problem in allen Studien. Wenn du einen Score generierst ist es meistens so, dass man nicht alle Werte benutzen muss, also durchaus einige Missings vorkommen können. Das ist im Programm dann auch einstellbar wo die Grenze sein soll.
Verzerrt werden allgemein deine Ergebnisse immer dann, wenn Missings selektiv sind, also besondere Gruppen oft fehlende Werte haben (z.B. alte Leute, arme Leute, usw...). Dagegen kannst du im Prinzip nichts machen. Eine Option ist Multiple Imputation, aber nur, wenn bestimmte Kriterien haltbar sind. Online findest du sehr viel Info zu dem Thema. Grundsätzlich ist wohl der Standard die listwise deletion wie in einer Regression, also der Fall fällt aus wenn nur ein Wert fehlt.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 685
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron