Ich arbeite mit einem multilevel data set, in dem Individuen in Ländern geclustered sind. Ich möchte gerne missings imputen für Einkommen und zwei Anxiety-Variabeln. So sieht mein Code bisher aus:
- Code: Alles auswählen
egen incrank = xtile(inc), n(100) by(country)
gen incrank_pdi = incrank * pdi // Interaction term
gen incrank_idv = incrank * idv // Interaction term
mi set mlong
mi register imputed inc stanx1 stanx2
mi register passive incrank incrank_pdi incrank_idv
set seed 46352
mi impute chained (pmm, knn(5)) inc stanx1 stanx2 incrank incrank_pdi incrank_idv = idv i.sex age i.educ i.empstat pdi idv gini_disp gdp i.country, add(5) rseed(46352)
mi passive: gen sa = (stanx1 + stanx2) / 2
mi estimate: mixed sa incrank inc educ age sex empstat pdi idv gdp gini_disp incrank_pdi incrank_idv || country: incrank, mle
Mein Analyse-Model ist ein mixed effects model mit random slope und zwei cross-level Interaktionen. Daher habe ich die 2 Interaktionsterme vor der Imputation als Faktor aus Income rank und Individualism / Power Distance generiert. Income rank ist auch eine passive Variable, da sie sich aus Einkommen ergibt.
Meine Fragen sind die folgenden:
1. Ich habe country im Imputations-Model als Faktor gekennzeichnet, um die Clusterung zu berücksichtigen. Ist dies ausreichend dafür oder müssen noch weitere Schritte unternommen werden? Muss ich auch die anderen level-2 Variablen anders kennzeichnen?
2. Sollen die passiven Variablen (sa; incrank; Interaktionsterme) in das Imputations-Model aufgenommen werden oder erst danach erstellt werden?
Ich wäre Euch für jede Art von Hinweisen und Hilfe sehr dankbar!
Liebe Grüße
Daniel