Oprobit Average marginal effects

Regressionsmodelle aller Art mit Stata.

Oprobit Average marginal effects

Beitragvon Annerika » Di 17. Dez 2013, 19:26

Liebe Leute,

ich untersuche Lebenszufriedenheit (ordinale Variable) die von 0-10 skaliert ist. Ich rechne ein oprobit Model.

Da ich die Koeffizienten der oprobit nicht direkt interpretieren kann (nichtlinearität) möchte ich mir die average marginal effects (AME)der Koeffizienten ausgeben lassen. Das bedeutet für jede unabhängige Variable (SEX; Income, Age, Married...) erhalte ich 11 AMEs.

margins, dydx(*) predict(outcome(0))
----
margins, dydx(*) predict(outcome(10))

Jetzt habe ich dann eine schöne Datenmenge produziert, da ich auch viele unabhängige Variablen habe.

Meine Frage: Wie gehe ich mit diesen 11 Werten pro unabhängige Variable um??? Kann ich den mittleren Wert dieser 11 Werte erfassen oder deren Wertebereich (detal min-max)?? Ich hänge da echt fest.

Meine Gutachterin meinte, ich soll mir auch nochmal standardisierte Koeffizienten ansehen (Long and Freese 2006 Kapitel 5).

listcoef

Da bekomme ich für jede unabhängige Variable einen schönen Wert ....aber geht das so einfach .zumal ich die Koeffizienten der oprobit nicht interpretieren kann (nur deren Vorzeichen).

Für jede Hilfe sehr dankbar,
Annerika
Annerika
 
Beiträge: 24
Registriert: Di 17. Dez 2013, 19:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Oprobit Average marginal effects

Beitragvon daniel » Mi 18. Dez 2013, 11:32

Hast Du die parallel odds assumption in Deinem Modell geprüft? In den meisten (praktischen Anwendungs)Fällen ist diese verletzt. Wenn das der Fall ist, kannst Du ein generalisiertes geordnetes Modell schätzen, was noch mehr Daten produziert und die Interpretation weiter verkompliziert, oder direkt ein lineares Modell mittels OLS schätzen. Das würde ich bei einem 11 stufigen Likert-Typ Item ohnehin tun.

Falls Du unbedingt bei geordneten Modellen bleiben möchtest, wieso schätzt Du kein geordnetes logit Modell? Dort kannst Du die odds-ratio interpretieren. Marginale Effekte sind m.E. ohnehin eine fragliche Geschichte, weil Du damit versuchst ein nicht-lineares Modell linear zu interpretieren. Wieso dann aber nicht direkt ein lineares Modell schätzen? Jemand hat mal das mal sinnhaft so beschrieben:

A mariagnal effect emerges from a model. If you need a model to interpret the results of your model, something wrong with your model.


Cross-posting: http://www.statistik-forum.de/regressio ... t3700.html
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Oprobit Average marginal effects

Beitragvon Annerika » Mi 18. Dez 2013, 13:17

Lieber Daniel,

danke für deine schnelle Antwort.

OLS wird in der Tat oft verwendet- ich nutzte es als "robustness check" am Ende meines papers.

Da die abhängige Variable latent ist, möchte ich beim oprobit bleiben...oh wunder wusste gar nix von ologit!!!

Dh. hier Neuland für mich. Kann ich die Koeffizienten von ologit direkt interpretieren??? Also als Likelyhood???

Ansonsten wäre ich so vorgegangen:

Was hälst du davon: (auch wenn ich deine Kritik zu AME sehr gut nachvollziehen kann :_))

Ich schätzte oprobit.
Dann die AME auf alle 11 Ausprägungen. Damit kann ich erkennen, wo der Cut zufrieden/unzufrieden liegt ...bei mir bei ist der zwischen SWB 6 und SWB 7.

Dann summiere ich alle AME SWB 0-6 als unzufrieden
und
AME SWB 7-10 als zufrieden.

Dh. ich erhalte einen Wert für die likelyhood von zufrieden und unzufrieden (die sich nur im vorzeichen unterscheiden da die summe der likeleyhoods ja null ist)
Annerika
 
Beiträge: 24
Registriert: Di 17. Dez 2013, 19:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Oprobit Average marginal effects

Beitragvon daniel » Mi 18. Dez 2013, 15:11

Da die abhängige Variable latent ist, möchte ich beim oprobit bleiben


Du meinst die latente Lebenszufriedenheit? In jedem Fall muss die parallel odds assumption erfüllt sein, sonst sind die Ergebnisse des Modells midestens ebenso fragwürdig, wie eines linearen Modells.

Dh. hier Neuland für mich. Kann ich die Koeffizienten von ologit direkt interpretieren??? Also als Likelyhood???


Naja, die Interpretation erfolgt eben in der Metrik als von Odds-Ratios.

Damit kann ich erkennen, wo der Cut zufrieden/unzufrieden liegt


Und wie machst Du das genau? Und wichtiger, wieso willst Du das outcome denn dichotomisieren?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Oprobit Average marginal effects

Beitragvon Annerika » Mi 18. Dez 2013, 19:14

Dank erneut für schnelle Rückmeldung.

In der Tat die parallel odds assumption habe ich nicht geprüft.... wie mache ich das mit Stata.

Das oprobit habe ich gewählt in Anlehnung an SWB Literatur die meist oprobit vorschlagen in der Tat aber OLS rechnen. Ich habe mich bewusst für oprobit entschieden da Long and Freese (2001 Kap. 5) schreiben das OLS bei ordinaler abhängigen Variable verzehrte Koeffizienten liefert.

Ich wundere mich nur da ich meine Gutachterin seit Tagen mit AME nerve warum sie auf dem oprobit "besteht" und mir nicht ein ologit ans Herz legt....wo doch die Interpretation so viel einfacher erscheint....??

Da die abhängige Variable nicht nur zwei, sondern viele Werte annehmen kann, hab ich mir überlegt welche Stufe mich besonders interessiert.... Mein Interesse liegt auf dem Wechsel von unzufrieden zu zufrieden (bzw andersrum). Alle 11 Stufen einzeln zu durchleuchten erscheint mir wenig sinnvoll. Daher die dichotomisierung bei der Interpretation.

Die Werte für den Cut (bei mir zwischen 6-7) habe ich erhalten bei schätzung des vollständigen oprobit modells (alle 11 Ausprägungen), dann habe ich über alle Variablen ein margin laufen lassen und das dann geplotet.
Annerika
 
Beiträge: 24
Registriert: Di 17. Dez 2013, 19:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Oprobit Average marginal effects

Beitragvon daniel » Mi 18. Dez 2013, 23:15

In der Tat die parallel odds assumption habe ich nicht geprüft.... wie mache ich das mit Stata.


Zunächst entschuldige meinen "Wortmix". Es ist die parallel regression oder proportional odds assumption.
Code: Alles auswählen
ssc inst oparallel
h oparallel


Ich habe mich bewusst für oprobit entschieden da Long and Freese (2001 Kap. 5) schreiben das OLS bei ordinaler abhängigen Variable verzehrte Koeffizienten liefert.


Hm, da hast Du ein gutes Buch (vollständige Literaturangaben sind hilfreich für Mitlesende), dass Du aber offenbar nur sehr selektiv gelesen hast. Die Autoren diskutieren sowohl das geordnete Logit Modell, als auch die proportional odds assumption und deren Test. Außerdem wird die Interpretation der Koeffizienzten dieser Modelle mehrseitig illustriert. Halte Dich doch daran.

Ich wundere mich nur da ich meine Gutachterin seit Tagen mit AME nerve warum sie auf dem oprobit "besteht" und mir nicht ein ologit ans Herz legt....wo doch die Interpretation so viel einfacher erscheint....??


Darüber kann ich nur spekulieren. Manche Personen halten OR für sehr schwierig zu interpretieren (ich nicht). Mache Personen (viele Ökonomen) fühlen sich mit Normalverteilten Fehlern (i.e. probit) wohler. Aber da kannst Du sie ja mal fragen.

Da die abhängige Variable nicht nur zwei, sondern viele Werte annehmen kann, hab ich mir überlegt welche Stufe mich besonders interessiert.... Mein Interesse liegt auf dem Wechsel von unzufrieden zu zufrieden (bzw andersrum). Alle 11 Stufen einzeln zu durchleuchten erscheint mir wenig sinnvoll. Daher die dichotomisierung bei der Interpretation.


Davon rate ich ab, weil Du (i) viel Information unnötig verwirfst, (ii) Deine Dichotomisirung auf einem Modell basierst, an dessen Qualität Du offenbar selbst zweifelst, da Du es nicht interpretierst.

Davon abgesehen machst Du hier den Fehler absoluter Interpretation relationaler Messungen. Nur weil Du positive oder negative Koeffizienten schätzt, bedeutet dass nicht, dass (i) es in der Realität so etwas wie einen trennscharfen Wechsel zwische zufrieden und unzufrieden gibt und (ii) erst recht nicht, dass Du die Messung der Lebenszufriedenheit für einzelne Personen absolut interpretieren kannst. Wenn Du angibst, Du bist mit Deinem Leben 7 zufrieden, während ich nur 5 zufrieden bin, dann kannst Du zwar relational interpretieren, dass Du zufriedener bist als ich (unter der Annahme, wir verstehen beide das selbe unter Zufriedenheit), aber Du kannst unmöglich absolut (ie. ohne Referenz) interpretieren, ich sei zufrieden oder unzufrieden, oder Du seist zufrieden oder unzufrieden.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Oprobit Average marginal effects

Beitragvon Annerika » Fr 20. Dez 2013, 16:54

Danke Daniel für deine schnelle und ausführliche Antwort.

Ich hänge noch immer in der Luft und stehe vor dem Problem

1. Nehme ich oprobit oder ologith

2. Wie interpretiere ich den output

Ich verstehe den Unterschied zwischen ologith und oprobit nicht....außer das ich ologith in OR interpretieren kann (oder ist das der Unterschied??) By the way, meine Gutachterin ist: bingo Ökonomin

Der Reihe nach:

Ich wollte die parallel regression oder proportional odds assumption prüfen

aber folgender Befehl geht nur für ologith

ssc inst oparallel
h oparallel

Für oprobit schreibt Long and Freece (Regression Models for Categorical Dependent Variables using Stata, 2006) omodel

Das erzeugt bei mir folgenden Output und damit viele Fragen :-)

matsize too small
You have attempted to create a matrix with too many rows or columns or attempted to fit a model with too many
variables. You need to increase matsize; it is currently 400. Use set matsize; see help matsize.

If you are using factor variables and included an interaction that has lots of missing cells, either increase matsize
or set emptycells drop to reduce the required matrix size; see help set emptycells.

If you are using factor variables, you might have accidentally treated a continuous variable as a categorical,
resulting in lots of categories. Use the c. operator on such variables.

Was tun?
Und wie komme ich mit dem Output zurecht ...für den Fall ich bleibe bei der oprobit?

Ulrich Kohler, Frauke Kreuter - Datenanalyse mit Stata (2012) schreiben von AME als eine Möglichkeit den output zu interpretieren ....aber ich habe ja das Problem wie oben beschreiben von zuviel output (11 Koeffizienten pro Variable) aber die Idee meiner Dichotomisirung verwirfst du...obwohl die mir meine Gutachterin angeraten hat nur eine bestimmte Stufe zu betrachten (natürlich nachdem ich begründen konnte warum ich diesen Abschnitt wähle)....ich finde deine Kritik an der Dichotomisirung allerdings sehr angebracht!!!

Dann gibt es auch die Möglichkeit von standardisierten Koeffizienten (listcoef) wat sagst du dazu?

Ich hänge leider sehr in der Luft da ich nur eine Einführung zu Stata hatte (nur OLS) und das hier mein Wissen um weiteres überschreitet..daher weiterhin dankbar für Hilfe, Grüße Annerika
Annerika
 
Beiträge: 24
Registriert: Di 17. Dez 2013, 19:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Oprobit Average marginal effects

Beitragvon daniel » Fr 20. Dez 2013, 19:02

1. Nehme ich oprobit oder ologith
[...]
Ich verstehe den Unterschied zwischen ologith und oprobit nicht....außer das ich ologith in OR interpretieren kann (oder ist das der Unterschied??)


Es heißt -ologit-, ohne h. Der Unterschied der beiden Modelle ist die Annahme, die Du über den Fehler triffst. Beim probit nimmst Du einen standard normalverteilten Fehler an, beim logit ist er standard logistisch verteilt. Da die beiden verteilungen sehr ähnlich sind (http://de.wikipedia.org/wiki/Normalverteilung vs. http://de.wikipedia.org/wiki/Logistische_Verteilung) bekommst Du in der Praxis sehr ähnliche Antworten. Die Interpretation ist m.E. im logit Modell einfacher/intutitiver -- aber das mag an meinem sozialwissenschaftlichen Hintergrund liegen. Ich habe noch nie eine "richtige" Argumentation für die Entscheidung zwischen diesen beiden Modellen gesehen, so dass ich schließen muss, dass es sich dabei um purer Konvention handelt.

2. Wie interpretiere ich den output


Wie bereits erwähnt diskutieren Long und Freese verscheidene Interpretationsmöglichkeiten. Welche geeignet ist hängt u.a. mit der konkreten Forschungsfrage zusammen. Vielleicht hilft Dir auch das blättern in diesen Seiten weiter:
http://www.ats.ucla.edu/stat/stata/outp ... output.htm
http://www.ats.ucla.edu/stat/stata/dae/ologit.htm


aber folgender Befehl geht nur für ologith

ssc inst oparallel
h oparallel

Für oprobit schreibt Long and Freece (Regression Models for Categorical Dependent Variables using Stata, 2006) omodel

Das erzeugt bei mir folgenden Output und damit viele Fragen :-)

matsize too small
You have attempted to create a matrix with too many rows or columns or attempted to fit a model with too many
variables. You need to increase matsize; it is currently 400. Use set matsize; see help matsize.
[...]

Was tun?


Ich bin selbst etwas überfragt, wesshalb -oparallel- auf logit Modelle beschränkt ist -- mag sein, dass die Berechnung bei probits komplexer ist, wobei ich auf den ersten Blick nicht verstehe, wesshalb das so sein sollte. Ohne die Syntax zu sehen, kann ich nicht allzuviel zur Fehlermeldung sagen, außer, dass Du mal -- wie ja von Stata vorgeschlagen -- die -matsize- erhöhst. Tipp

Code: Alles auswählen
h matsize


Dann gibt es auch die Möglichkeit von standardisierten Koeffizienten (listcoef) wat sagst du dazu?


Ich kann mit standardisierten Koeffizienten relativ wenig anfangen, weil m.E. Standardabweichungen weit unintutiver zu interpreteiren sind, als die original Metrik der Variablen.

Ich hänge leider sehr in der Luft da ich nur eine Einführung zu Stata hatte (nur OLS) und das hier mein Wissen um weiteres überschreitet..


Häng Dich nicht zu sehr an der Software auf. Es geht hier in erster Linie um eine inhaltliche Fragestellung. Die ökonometrischen Modell und deren Umsetzung in einer spezifischen Software sind "Hilfestellungen" zur Beantwortung dieser inhaltlichen Fragestellungen.


Long, J. S, Freese, J. (2006). Regression Models for Categorical and Limited Dependent Variables Using Stata. College Station, TX: Stata Press.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Oprobit Average marginal effects

Beitragvon Annerika » Fr 20. Dez 2013, 20:04

Wieder Dank!

Ich lese gerade:

Happiness Quantified: A Satisfaction Calculus Approach
Bernard M. S. van Praag and Ada Ferrer-i-Carbonell (2007)
http://www.oxfordscholarship.com/view/1 ... -chapter-2

Die Autoren entwickeln ein probit adapted OLS Model (POLS): which appears in most cases to yield roughly the same results as Ordered Probit, but which is much easier to understand, requires much less computing time, and can be much easier generalized to more complex models

Hast du damit Erfahrung , bzw wat hälst du davon?
Annerika
 
Beiträge: 24
Registriert: Di 17. Dez 2013, 19:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Oprobit Average marginal effects

Beitragvon daniel » Mi 25. Dez 2013, 15:25

Hab ich ehrlich gesagt nur am Rande mitbekommen. Wird das nicht eher im Falle von Paneldatenanalyse verwendet, weil es keinen konsistenten FE Schätzer in diesem framework gibt?

So ganz dunkel meine ich mich zu erinnern, dass es da Diskussionen um potentiell Verzerrte Schätzer bei dieser Methode gab, aber genaueres müsste ich jetzt auch nachlesen.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Regressionsmodelle

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 15 Gäste

cron