STATA-FORUM.DE

simse · von **simse** » Mi 2. Okt 2013, 23:11

Hallo,

ich mache gerade die ersten Schritt mit Stata im allgemeinen sowie Stata 12 im besonderen und stelle mich gerade vermutlich ein wenig hilflos an.
Ich möchte mit meinem Datensatz, der schon alle benötigten Variablen (Dummys und metrische) enthält, Mincer-Regressionen durchführen. Dazu muss ich ja das logarithmierte Einkommen (LnLabsum) auf diese ausgewählten Variablen regressieren. Soweit so gut, da ich einzelne Regressionen für verschiedene Studiengänge zusammen durchführen will, habe ich diese in der Variablen field11 gespeichert.

Mit dem Befehl (ich habe die unabhängigen Variablen ausgelassen daher ...):
. by field11, sort : regress LnLabsum ... , vce(hc3) beta

bekomme ich ja den normalen Output für jede der Regressionen.

Meine Frage ist nun, wie ich mir für alle Studiengänge den jeweiligen Fehlerterm der Regression anzeigen lassen kann sowie dessen Standardabweichung. Da ich beide Werte für die weitere Auswertung benötige.

Hoffentlich konnte ich mein Problem verständlich formulieren.

Vielen Dank im Voraus!

daniel · von **daniel** » Do 3. Okt 2013, 11:15

Du könntest mittels -predict- und -residuals- Option (help regress postestimation##predict) die Residuen für alle Beobachtungen erzeugen. Anschließend gibt Dir -summarize- Mittelwert, Standardabweichung etc. an. Ist es das, was Du suchst?

Allerdings lässt sich das nicht mit dem -by- prefix kombinieren. Zudem wilst Du sicher die jeweiligen Werte nicht nur ansehen, sondern auch in irgendeiner Form speicher, wenn Du sie für weitere Analysen verwenden willst. Etwas in dieser Richtung vielleicht?

Code: Alles auswählen: // get the levels of field11 (assuming integer values) qui levelsof field11 ,l(lvls) loc nlvls : word count `lvls' // set up result matrix for means and sd mat R = J(`nlvls', 2, .) // set a temporary variable for the residuals tempvar resid // set counter for regressions loc row = 0 // now run the regressions and collect the residuals foreach x of loc lvls { qui { loc ++row reg LnLabsum <...> if (field11 == `x') ,vce(hc3) // predict residuals predict `resid' ,r // summarize residuals su `resid' // put mean and sd into matrix mat R[`row', 1] = r(mean) mat R[`row', 2] = r(sd) // drop the residuals drop `resid' } } // look at results matrix matlist R

simse · von **simse** » Do 3. Okt 2013, 23:53

Hallo Daniel,

vielen Dank für die schnelle und ausführliche Antwort.
Ich hatte mir nach einigem Probieren auch etwas wie Deinen ersten Vorschlag überlegt und die Werte dann zur Not in einer Excel-Tabelle sammeln und wieder einlesen wollen (sind ja nicht so viele). Aber ich werde Deinen zweiten Vorschlag auf jeden Fall ausprobieren, denn der würde vieles einfacher machen.

Bevor ich aber diese Regression durchführe, wollte ich mich noch an einer anderen Mincer-Regression ausprobieren. Dafür muss ich bestimmte Dummys bilden, die einfachen, für Items die schon in einer Variablen waren, war das machbar. Allerdings brauche ich für diese Variante auch andere Dummys, bei denen ich keine Idee zur Erstellung habe.

Es geht bei diesem Dummy, um verschiedene Bildungsniveaus. Ich habe schon separate Dummys erstellt für das Vorliegen einen Abiturs (bbpabi), Lehre (train11BAB), FH (degree11FH) und Uni (degree11Uni). Diese sind alle 0 (nein) und 1 (ja) kodiert.
Nun habe ich in einer Variablen (bbpsbil) Informationen zu den verschiedenen Schulabschlüssen. Mich interessiert in dieser Variablen Eintrag Nummer [6] "ohne Abschluss verlassen". Aus den genannten Dummys/Variablen möchte ich nun Dummys (je einen für Abi, Lehre, FH und Uni) erstellen, die "ohne Abschluss verlassen" als Referenzwert benutzen und den Effekt für das Vorliegen des jeweiligen Abschlusses angeben.
Als Kodierung für den neuen Abi-Dummy also 0 - ohne Abschluss verlassen und 1 - Abschluss Abi

Daher meine Frage, ob es möglich ist (bzw. wie), einen neuen Dummy aus zwei Variablen zu erstellen.

Vielleicht hat jemand eine Idee. Vielen Dank im Voraus!

daniel · von **daniel** » Fr 4. Okt 2013, 10:39

Entweder ich verstehe das Problem nicht, oder Du bist verwirrt, was die Interpretation der Dummies (Indikator variableln) angeht.

Wenn Du bereits Indikatoren für jeden der Schulabschlüsse

biturs (bbpabi), Lehre (train11BAB), FH (degree11FH) und Uni (degree11Uni)

hast, und nun alle simulatan in Deinem Modell berücksichtigst, ist die Refreenz doch diejenigen, für die kein Indikator im Modell ist. Das scheint in diesem Fall dann "ohne Abschluss verlassen" zu sein,da hierfür kein Indikator erzeugt wurde.

Deine Idee einen (oder mehr) Indikator zu erzeugen, der nur ein Abitur von keinem Abschluss unterscheidet, leuchtet mir nich ein, da bei der Verwendung im Modell alle Personen, die kein Abitur, aber einen anderen Abschluss haben ausgeschlossen werden (listwise deletion). Der Indikator hätte nämlich fehlende Werte für alle anderen Abschlüsse und Du würdest so nur seperate Regressionen für jeden der einzelnen Abschlüsse (jeweils im Kontrst zu keinem Abschluss) schätzen können. Das scheint kein sinnvolles Vorgehen.

Die Wahl "ohne Abschluss verlassen" als Referenz ist nicht unbedingt klug. Ich gehe davon aus, das diese Kategorie extrem schwach besetzt ist. Das kann zu Problemen bei der Schätzung führen.

STATA-FORUM.DE

(Mincer-)Regressionen und Ausgabe der Fehlerterme

(Mincer-)Regressionen und Ausgabe der Fehlerterme

Re: (Mincer-)Regressionen und Ausgabe der Fehlerterme

Re: (Mincer-)Regressionen und Ausgabe der Fehlerterme

Re: (Mincer-)Regressionen und Ausgabe der Fehlerterme

Wer ist online?