Logistische Regression: AMEs bei kategorialen Variablen

Regressionsmodelle aller Art mit Stata.

Logistische Regression: AMEs bei kategorialen Variablen

Beitragvon _lry » Mi 18. Sep 2019, 19:02

Ich rechne aktuell eine logistische Regression im Rahmen eines Uni Projekts.
Meine erklärende Variable hat insgesamt 5 Ausprägungen, weshalb ich mir mit i. Faktorvariablen ausgeben lassen habe.
In dem Wissen, dass ich die Logit Koeffizienten nicht einfach inhaltlich interpretieren kann, habe ich mir mit dem margins Befehl mit der Option dydx(*) marginale Effekte ausgeben lassen.

Nun zu meinen Fragen:
1) Mit dem margins-Befehl und anschließendem marginsplot bekomme ich die Conditional Effects ausgegeben (bivariate Betrachtung). Wo liegt hier genau der Unterschied zu den AMEs?

2) Die marginalen Effekte geben doch eigentlich den durchschnittlichen Effekt der UV bei Steigung um eine Einheit auf die Auftrittswahrscheinlichkeit des Ereignisses an? Warum bekomme ich dann für jede Kategorie einen anderen marginalen Effektkoeffizienten ausgegeben? (Meine Interpretation: Der durchschnittliche Effekt der UV für alle Beobachtungen dieser Kategorie, der aber für jede Kategorie unterschiedlich ist. Richtig?).

3) Wenn ich dydx(Var) angebe, bekomme ich die marginalen Effekte für die angegebene Variable in der Klammer ausgegeben (richtig?). Diese Zusatzoption brauche ich also nur im Fall meiner multivariaten Betrachtung (richtig?).

Ich danke Euch jetzt schon 1000 Mal und hoffe auf rege Antworten!
Falls ihr nen hilfreichen Lehrbuchartikel habt, freue ich mich auch auf Anregungen (ich hab jetzt schon einige gelesen, zu meiner speziellen Verwirrung aber nichts gefunden).

Liebe Grüße und DANKE!
_lry
 
Beiträge: 4
Registriert: Mi 7. Aug 2019, 14:33
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression: AMEs bei kategorialen Variablen

Beitragvon Staxa » Fr 20. Sep 2019, 13:17

1. Margins ohne Option gibt dir Wahrscheinlichkeiten aus, etwa
Code: Alles auswählen
margins gruppe

Damit bekommst du für jede Gruppe getrennt die Wahrscheinlichkeit, das Outcome zu erleben.
Hingegen
Code: Alles auswählen
margins, dydx(gruppe)

Gibt dir die Differenz zur Referenzgruppe in Prozentpunkten. Also ist der Wert bei Gruppe 2 dann 0.5, so heisst das, dass diese Gruppe eine um 50 Prozentpunkte höhere Wahrscheinlichkeit hat, das Outcome zu erleben, als die Referenz.

2. Wenn du eine kategoriale Variable hast, so gibt jeder AME eben die Differenz zur Referenz aus, siehe Punkt 1 oben.

3. Was du brauchst hängt davon ab, was du wie berichtest bzw. interpretierst. Wahrscheinlichkeiten sind anschaulich, aber auch AMEs können sinnvoll sein. An deiner Interpretation sollte dies nichts ändern.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 685
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression: AMEs bei kategorialen Variablen

Beitragvon _lry » Mo 23. Sep 2019, 16:23

Vielen vielen Dank! Bin mittlerweile gut damit klargekommen.

Jetzt hab ich allerdings noch eine Frage zu meinem Interaktionseffekt.

Welche marginalen Effekte lasse ich mir am besten ausgeben?
Die AMEs mit der Option dydx? (finde die Darstellung des marginsplot da sehr umständlich)
Die Predictive means mit dem Befehl:
Code: Alles auswählen
margins x1, by(x2)

oder die predictive means mit dem Befehl:
Code: Alles auswählen
margins, at(x1=(…) x2=(…))


Ich bekomme mit dem letzten Befehl keine signifikanten Unterschiede ausgegeben, mit dem ersten schon.

Liebe Grüße
_lry
 
Beiträge: 4
Registriert: Mi 7. Aug 2019, 14:33
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression: AMEs bei kategorialen Variablen

Beitragvon _lry » Mo 23. Sep 2019, 22:48

Noch eine zusätzliche Frage: Ich möchte aufeinander aufbauende Modelle miteinander vergleichen. Kann ich mir hier auch die vorhergesagten Wahrscheinlichkeiten ausgeben lassen oder müssen es AMEs zum Vergleich sein?
Danke! :)


Staxa hat geschrieben:1. Margins ohne Option gibt dir Wahrscheinlichkeiten aus, etwa
Code: Alles auswählen
margins gruppe

Damit bekommst du für jede Gruppe getrennt die Wahrscheinlichkeit, das Outcome zu erleben.
Hingegen
Code: Alles auswählen
margins, dydx(gruppe)

Gibt dir die Differenz zur Referenzgruppe in Prozentpunkten. Also ist der Wert bei Gruppe 2 dann 0.5, so heisst das, dass diese Gruppe eine um 50 Prozentpunkte höhere Wahrscheinlichkeit hat, das Outcome zu erleben, als die Referenz.

2. Wenn du eine kategoriale Variable hast, so gibt jeder AME eben die Differenz zur Referenz aus, siehe Punkt 1 oben.

3. Was du brauchst hängt davon ab, was du wie berichtest bzw. interpretierst. Wahrscheinlichkeiten sind anschaulich, aber auch AMEs können sinnvoll sein. An deiner Interpretation sollte dies nichts ändern.
_lry
 
Beiträge: 4
Registriert: Mi 7. Aug 2019, 14:33
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression: AMEs bei kategorialen Variablen

Beitragvon Staxa » Mi 25. Sep 2019, 09:37

Bezüglich der signifikanten Unterschiede ist natürlich wichtig, WAS deine Referenz ist. Deshalb dürfen die Interpretationen nicht anders sein, sofern die Referenz immer gleich ist. Deshalb prüfe mal genau, was die Befehle genau ausgeben und was jeweils die Referenz ist. Ohne deine Daten zu kennen kann ich das so nicht testen was du machst.

Bezüglich Vergleiche über Modelle hinweg sollte beides gehen, allerdings würde ich hier nochmals nachlesen um auch die Randbedingungen im Blick zu behalten:
https://www.semanticscholar.org/paper/L ... 90ceefe42c
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 685
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Regressionsmodelle

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 3 Gäste

cron