Hallo ihr Lieben,
ich brauche bitte unbedingt Hilfe.
Es geht um folgendes: Ich muss eine Hausarbeit schreiben mit dem Thema: Wie ist der Zusammenhang zwischen Einkommen in Bezug als Geschlecht, Alter, Bildungsabschluss.
Ich möchte eine multiple lineare Regression machen.
Folgendes habe ich bereits kodiert in Stata: (Kopie von meinem DO_FILE)
*Abhängige Variable*
lookfor Nettoeinkommen
tab v347
tab v347, nolab
mvdecode v347, mv(97=.)
mvdecode v347, mv(99=.)
clonevar Nettoeinkommen = v347
recode Nettoeinkommen (0/8 = 1 "0€-999€") (9/14 = 2 "1000€-1999€") (15/22 = 3 "2000€-7500€u.mehr") , gen (NettoeinkommenVereinfacht)
tab NettoeinkommenVereinfacht
*Unabhängige Variablen*
tab1 v221 v217 v230
*Missings umkodieren für Alter und Geschlecht*
mvdecode v221, mv(9=.)
tab v221
mvdecode v230, mv(99=.)
tab v230
*Unabhängige Variablen namtlich umkodieren*
clonevar AlterKategorisiert = v221
clonevar Geschlecht = v217
clonevar AllgSchulabschluss = v230
Welchen Befehl muss ich nehmen für eine korrekte Regression?
1. regress Nettoeinkommen ib1.Geschlecht i.AlterKategorisiert i.AllgSchulabschluss
oder
2. regress Nettoeinkommen ib1.Geschlecht AlterKategorisiert AllgSchulabschluss
oder
3. regress Nettoeinkommen ib1.Geschlecht##AlterKategorisiert##AllgSchulabschluss
?
Ich bedanke mich schon im Voraus von ganzem Herzen für Eure Hilfe.