Modelldiagnostik bei logistischer Regression

Fragen zu Stata Syntax und Do-Files.

Modelldiagnostik bei logistischer Regression

Beitragvon statistica » Mo 20. Aug 2012, 22:15

Hallo,

ich habe mein Problem auch schon in meinem anderen Faden geschildert, die Überschrift passt allerdings nicht.

Ich habe eine logistische Regression mit zwei unabhängigen Variablen (UV1 ist metrisch, UV2 binär) und deren Interaktion durchgeführt. Nun wollte (sollte? laut Buch) ich das Modell auf Linearität und Ausreißer prüfen sowie einen LR-Test durchführen.

Den LR-Test wollte ich mit dem vollen und dem Nullmodell machen, da gibt Stata mir allerdings die Warnung "observations differ" aus. Das gleiche beim Vergleich mit dem Modell, in das nur die UV1 aufgenommen wurde. Weil ich dafür keine Lösung weiß, habe ich dann das volle Modell mit dem Modell mit beiden UVs, aber ohne Interaktionseffekt verglichen. Geht das? Ich verstehe die Interpretation des Ganzen nämlich noch nicht so ganz...

Die Linearität wird über den lowess geprüft. Ich habe also die Befehle:

lowess AV UV1, jitter(2) bwidth (.5) -> gibt in etwa s-förmigen Verlauf, der ja gewünscht ist

lowess AV UV2, jitter(2) bwidth (.5) -> gibt eine absteigende Linie (mir fällt allerdings gerade auf, dass ich den Wertebereich nicht mehr im Kopf habe)

lowess AV Interaktionsterm, jitter(2) bwidth (.5)

Ich bin mir nicht sicher, ob der letzte Befehl Sinn ergibt? Und was mache ich, wenn der gewünschte s-förmige Verlauf eben nicht gegeben ist? Gilt dann das Modell (bzw. seine Ergebnisse) nicht mehr?

Und wie prüfe ich auf Ausreißer?

Danke für die Hilfe!
statistica
 
Beiträge: 7
Registriert: Do 16. Aug 2012, 09:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Modelldiagnostik bei logistischer Regression

Beitragvon daniel » Di 21. Aug 2012, 11:54

Der LR Test zwischen aktuellem Modell und Nullmodell wird doch standardmäßig vom -logit- command ausgegeben. Ich verstehe nicht ganz, was Du hier gemacht hast, bzw. machen wolltest. Die Fallzahlen solltest Du auf jeden Fall über die Modelle konstant halten (zu weiteren Problemen schrittweise aufgebauter nicht-linearer Modelle vgl. Mood, 2010). Das ist in Stata sehr leicht. Schätze Dein volles Modell und behaöte nur die Beobachtungen, die in diesem Modell berücksichtigt werden. Die sind nach der Schätzung in e(sample) markiert.

Code: Alles auswählen
logit <myfullmodel>
keep if e(sample)
logit <myreducedmodels>


Lineariät eines binären Prädiktors (UV2) zu testen ist sinnfrei. Binäre Prädikatoren können keinen linearen Effekt haben.

Für weitere Fragen, schau mal hier: http://www.ats.ucla.edu/stat/stata/webb ... talog3.htm rein.


Mood, Carina (2010). Logistic Regression: Why We Cannot Do What We Think We Can Do, and What We Can Do About It . European Sociological Review, 26(1), 67-82.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Modelldiagnostik bei logistischer Regression

Beitragvon statistica » Di 21. Aug 2012, 21:31

Danke für deine Antwort!

Das Buch hat als LR-Test folgenden Befehl angegeben (angepasst an meine Variablen):

logit AV UV1 UV2 interakt
estimates store full

logit AV
lrtest full

Das wäre der Vergleich meines Modells mit dem Nullmodell, wobei mir Stata dabei die Warnung "oberservations differ" ausgegeben hat. Funktioniert hats nur beim Vergleich des vollen Modells mit dem Modell ohne Interaktion.

Ich verstehe nicht, was man über den von dir angegebenen Befehl ablesen kann?

Beim Linearitätstest mit der Interaktionsvariable kommt kein s-förmiger Zusammenhang raus. Was ist davon nun die Konsequenz?
statistica
 
Beiträge: 7
Registriert: Do 16. Aug 2012, 09:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Modelldiagnostik bei logistischer Regression

Beitragvon daniel » Di 21. Aug 2012, 23:28

Tippe mal in Stata

Code: Alles auswählen
sysuse nlsw88 ,clear
logit union wage hours
est sto full
keep if e(sample)
logit union
lrtest full


Und nun vergleiche mal das Ergebnis des -lrtest- Befehls mit der Ausgabe des ersten -logit- Befehls. Du wirst feststellen, dass beide eine Chi2 Wert von 43.91 mit einem zugehörigen p-value von 0,0000 angeben. Das meinte ich, als ich schreib, dass der LR Test mit dem Nullodell standardmäßig ausgegeben wird, und muss nicht extra berechnet werden muss.

Welchen meiner angegebenen Befehle verstehst Du nicht?

Bei den Interaktionen müsste ich nochmal nachdenken, aber spontan bin ich mir über den Sinn der Überprüfung der Linearität einer "Interaktionsvariable" ohne die Variablen, die sie bilden nicht sicher.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Modelldiagnostik bei logistischer Regression

Beitragvon statistica » Mi 22. Aug 2012, 00:04

Oh, ich habe grad selbst festgestellt, dass ich da Quatsch gedacht habe.

Gut, dann vergleiche ich eben das volle Modell mit dem Modell ohne Interaktionsvariable. Damit teste ich doch die Signifikanz der Interaktionsvariablen, oder?

Was mir bis jetzt noch große Probleme bereitet, ist dieses Linearitäts- und Ausreißerproblem. Kannst du mir dazu nochmal meine Fragen beantworten? :

Bei der Überprüfung der Interaktionsvariable kommt kein s-förmiger Verlauf heraus. Was sagt das über das Modell? Müsste es modifiziert werden?

Welche Tests müsste ich - außer auf Ausreißer und Linearität - noch durchführen?

Danke!
statistica
 
Beiträge: 7
Registriert: Do 16. Aug 2012, 09:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Modelldiagnostik bei logistischer Regression

Beitragvon daniel » Mi 22. Aug 2012, 13:38

Gut, dann vergleiche ich eben das volle Modell mit dem Modell ohne Interaktionsvariable. Damit teste ich doch die Signifikanz der Interaktionsvariablen, oder?

Nein, die Signifikanz der Interaktion liest Du am p-Wert dieser Variablen im output ab.

Ob die Interaktionsvariable, ohen Berücksichtigung der Bestandteile, eine s-förmigen verlauf aufweisen soll, darüber bin ich mir selbst noch immer nich schlüssig. Ob Dein Modell modofiziert werdn muss/soll, hängt aber sicher nicht nur von scalaren Maßzahlen und Omnibustests ab, sondern maßgeblich auch vom Sinn und Zweck, wesshalb Du dieses Modell schätzt.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Modelldiagnostik bei logistischer Regression

Beitragvon statistica » Mi 22. Aug 2012, 14:28

Jetzt bin ich verwirrt. Also, noch mehr.

Im Kohler/Kreuter-Buch (Datenanalyse mit Stata) steht, dass die Signifkanz eben nicht so einfach aus dem Output abgelesen werden kann?
Und was teste ich denn dann mit dem LR-Test?

Mit der Diagnostik meine ich, dass man ja z.B. bei der linearen Regression auch nichtlineare Effekte so transformieren muss, damit man eine lineare Regression rechnen kann.
Welche Annahmen sind da bei der logistischen Regression zu testen?
statistica
 
Beiträge: 7
Registriert: Do 16. Aug 2012, 09:48
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Modelldiagnostik bei logistischer Regression

Beitragvon daniel » Mi 22. Aug 2012, 17:42

Ich denke wir sind weit über Fragen der Syntax Stata betreffend hinaus. Wenn Du gerne von mehr Leuten Antworten möchtest, empfehle ich diese Fragen im Statistik-Forum zu stellen.

Kannst Du etwas genauer angeben, an welcher Stelle Kohler/Kreuter behaupten, das Signifikanzniveau lasse sich nicht einfach aus dem output ablesen? Ich kann das auf Anhieb nicht finden. Möglicher Weise beziehen sich die Autoren auf das Problem, dass die Koeffizienten nicht die marginalen Effekte widerspiegeln (vgl. dazu Ai und Norton 2003). Die Frage ist, wie tief Du in diese Problematik einsteigen willst und kannst. Es gibt einige Leute, die der Meinung sind, spezifische Probleme nicht-linearer Modelle seien schlicht nicht zu lösen, und es deshalb nicht Wert sich den Kopf darüber zu zerbrechen.


Ai, Chunrong , Norton, Edward C. (2003). Interaction terms in logit and probit models. Economic Letters, 80, 123-129.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Stata Syntax

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste

cron