Hallo Zusammen,
ich muss in meiner Arbeit kurz die Voraussetzungen der multiplen linearen Regression erwähnen (falls eine Voraussetzung nicht erfüllt ist muss ich das erwähnen aber trotzdem die Regression rechnen).
Ich bin mir leider sehr unsicher, ob ich diese in Stata richtig geprüft habe.
Meine "Haupt"-UV ist eine kategoriale Variable, meine anderen UV's und die AV sind metrisch.
1. Die Modellspezifikation und lineare Beziehung habe ich mit diesen Befehl geprüft:
quietly reg .....
estat ovtest
avplots
Dies habe ich jeweils für jede Regression einzeln gemacht, die ich vorher gerechnet habe.
2. Homoscedasticity habe ich so getestet:
quietly reg ...
estat hettest
und das Ganze auch wieder einzeln für jede Regression
3. No autocorrelation
gen Index = _n
tsset Index
estat dwatson
4. Normal distribution
predict RESIDUEN, resid
sktest RESIDUEN
histogram RESIDUEN
rvfplot, yline(0)
5.No multikollinearität
quietly reg ...
vif
Das habe ich auch für jede einzelne Regression geprüft.
Ist das denn so korret? Und reicht das? Ich habe gelesen, dass diese Voraussetzungen auch noch erfüllt sein müssen: Mittelwert des Störterms =0 und Exogenität der unabhängigen Variablen. Dazu finde ich aber kein Test für Stata. Weiß jemand, wie ich das testen kann?
Und bei der kategorialen Variable kann die Linearität und Normalverteilung doch nicht vorliegen oder? Ignoiert man hier diese Voraussetzung?
Ich bin leider ein Statistik Neuling und wäre für jede Hilfe wirklich sehr dankbar!