Hallo an alle,
für eine Arbeit möchte ich eine multivariate Regression durchführen und habe Probleme beim Erstellen einer Variable. Ich möchte eine Variable erstellen, die alle Migranten 2. Generation umfasst. Gegeben ist eine Variable zu Personen, die selbst migriert sind (1. Generation) sowie zum Herkunftsland der Elternteile. Meine Idee war es nun, eine Dummy-Variable mit dem if-Präfix zu erstellen, die 1 annimmt, wenn die Mutter oder der Vater Migranten sind. Die Migranten der ersten Generation wollte ich dann als Missing Value setzen, da diese ja nicht dazu gehören, allerdings auch meist ausländische Elternteile haben.
Leider habe ich aber das Problem, dass bei diesem Schritt auch eine große Menge an Personen mit Deutschen Eltern als Missing gesetzt werden - so viele, dass es keinen Sinn machen würde. Die Zahlen stimmen also nicht, wenn ich es überprüfen möchte.
Wie würdet ihr also eine solche Variable zu Migranten der 2. Generation erstellen? Würdet ihr es anders machen? Ich finde leider keinen Fehler und bin echt ratlos.
Tausend Dank schonmal für die Hilfe.