Hallo Stata-Welt,
ich bin mir nicht sicher, für welche Modell-Konstruktion ich mich entscheiden soll, ich hoffe, ihr könnte mir weiterhelfen:
Ich teste mit einem großen sample (Beobachtungen 1373) einen Zusammenhang und kontrolliere dabei für regionale Zugehörigkeit und Job-Bezeichnung (=23 Dummy-Variablen).
In einem nächsten Schritt werden die Beobachtungen auf Abteilungsebene geclustert und weitere Analysen gefahren, so dass die Stichprobe nur noch 119 Beobachtungen fasst. Wenn ich das Modell mit den identischen Kontroll-Variablen laufen lasse ergibt sich ein R2 von 0,3932 und ein adj. R2 von 0,2223, also eine recht große Differenz. Wenn ich die Kontroll-Variablen Region und Job weglasse, ändern sich die Ergebnisse für R2 (0,2253) und adj. R2 (0,1838).
Ich bin mir unsicher, ob ich die Kontroll-Variablen im Modell lassen soll, da sich adj. R2 verbessert oder ob ich sie nicht in die Regression aufnehmen sollte, da das Modell überspezifiziert ist (große Differnez R2 and adj. R2).
Für euren Rat wäre ich sehr dankbar.
VG
Matiz