Hallo zusammen,
ich habe eine grundsätzliche Frage zum Umgang mit Missings und hoffe ihr könnt mir dazu vielleicht ein paar Tipps geben.
Ich habe in meinem Datensatz viele Variablen aus denen ich eine neue Variable generieren muss. Bspw. besteht die Variable Studieninteresse oder Perfektionismus aus mehrere Items, aus denen ich einen mean score bilde. Leider habe ich auch einige Missings bei diesen Items. Folge natürlich, dort wo ein Missing ist wird auch kein mean score für meine Variablen gebildet. Somit habe ich ganz unterschiedliche Beobachtungen (N) für meine verschiedenen Variablen. Bei den meisten Studien, die ich gelesen habe, ist das N bei den verschiedenen Variablen meistens gleich. Daher bin ich etwas verunsichert, wie ich damit nun umgehen soll.
Alle Beobachtungen zu löschen, bei denen Missings vorkommen, ist allerdings problematisch, da ich sonst einen sehr großen Datenverlust hätte.
1. Wie gehe ich am besten damit um, bzw. was sollte ich bei der Analyse beachten (z.B. deskriptive Statistiken) oder kann ich die unterschiedlichen N einfach so hinnehmen?
2. Seht ihr es als kritisch, ein Item der Skala (bei dem besonders viele Missings auftreten) bei der Berechnung des mean score rauszulassen? (Reliabilität würde sich nur geringfügig <0,01 verändern)?
3. ist es richtig, dass bei der Korrelations-/Regressionsanalyse Missings keine Rolle spielen, da sie in die Analyse sowieso nicht mit eingehen? Aber verzerren Missings die Schätzung trotzdem?
Vielen Dank schonmal vorab. Ich würde mich sehr freuen, wenn mir jemand helfen kann.
LG