Logistische Regression

Allgemeine Fragen rund um Statistik mit Stata.

Logistische Regression

Beitragvon Kitty » Mi 27. Mär 2013, 18:49

Hallo!
Ich hoffe wieder mal, dass mir jemand helfen kann.
Ich habe dieses Mal eine inhaltliche Frage. Ich mache eine logistische Regression und habe wirklich sehr viele Variablen drinnen, weil diese in der Literatur als ausschlaggebend gelten.
Das Problem ist jetzt Folgendes: Habe ich nur wenige Variablen drinnen, sind viele davon signifikant. Je mehr Variablen ich aber aufnehme, desto weniger bleiben signifikant...
Grundsätzlich sollte man ja alle Variablen in die Analyse miteinbeziehen, wenn es theoretische Hinweise hierfür gibt. Im Grunde will ich das auch - nur es bleiben mir dann fast keine signifkanten Variablen mehr übrig. Und auch wenn die Frage vielleicht vollkommen idiotisch klingt: Hätte ich das eine Modell, wäre die VAriable signifikant und in dem anderen ist sie das auf einmal nicht mehr. Dass sich die Werte ändern, ist natürlich klar. Aber trotzdem: Ich dachte, entweder trägt etwas zur Erklärung der AV bei oder nicht? Ich weiß jetzt nicht so recht, was ich tun soll...
Irgendwie kenn ich mich grad gar nimma aus....
Lg, Claudia
Kitty
 
Beiträge: 17
Registriert: Fr 29. Jun 2012, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression

Beitragvon daniel » Mi 27. Mär 2013, 19:37

Es kann zwei Gründe dafür geben, dass Variablen in "größeren" Modellen nicht mehr signifikant sind. Durch fehlende Werte wird Dein Analysesample mit vielen Variablen potentiell kleiner, als mit wenigen Variablen. Ein kleineres Sample führt zu höheren Standardfehlern. Wie Du mit fehlenden Werten umgehen möchtest/kannst, bleibt Dir überlassen. Greifst Du auf (den default) listwise deletion zurück, musst Du unbedingt die Fallzahlen über die Modelle konstant halten.

Der zweite Grund ist so umfangreich, dass ich ihn in einem Forum nicht erklären kann. Es scheint, Du hast noch einige Lücken, was die grundlegende Idee der Regression angeht. Ich gebe daher ein einfaches Beispiel. Angenommen wir "erklären" Arbeitslosikeits Risiko mit Migrationshintergrund und stellen fest, dass der Migrationshintergrund einen signifikanten Effekt hat. Nun kontrollieren wir im nächsten Modell für Bildung. Angenommen Migranten haben eine geringere Bildung als Einheimische, und es ist "in Wahrheit" die Bildung, nicht der Migrationshintergrund, der das Arbeitslosigkeitsrisiko bestimmt. Würdest Du dann noch immer einen signifikanten Effekt des Migrationshintergundes im zweiten Modell erwarten? Ich hoffe nicht.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression

Beitragvon Kitty » Do 28. Mär 2013, 15:49

hallo daniel!
vielen dank für deinen - wie immer sehr schnellen und guten - beitrag. da der datensatz relativ groß und die missings relativ gering sind, liegt es sicherlich an zweiterem grund. ich hab das schon verstanden, was du mit dem bespiel sagst. bei zwei UVs ist das auch nicht weiter ein problem, da kann man ja durchtesten. aber wie gehe ich vor, wenn ich - so wie ich - 28 UVs habe? da gibts ja praktisch unendlich viele kombinationsmöglichkeiten...
Kitty
 
Beiträge: 17
Registriert: Fr 29. Jun 2012, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Logistische Regression

Beitragvon daniel » Do 28. Mär 2013, 16:34

Ich weiß nicht, was Du mit Kombinationsmöglichkeiten meinst. Unabhängig von der Anzahl der Variablen im Modell, sind die Effekte immer die eigenständigen der jeweiligen Variable unter Kontrolle aller weiteren Variablen. Da gibt es nichts durchzutesten, das macht das Verfahren quasi "automatisch" richtig. Allerdings sollte man die Kollinearitätsproblematik nicht aus dem Auge verlieren.

Es ist schwer mehr zu sagen, ohne nähere Informationen. Ein Modell mit 28 Prädikatoren scheint relativ groß. Technisch setzt das eine Große Anzahl an Beobachtungen vorraus. Um inhaltlich etwas zu sagen, müsste man u.a. wissen was die Forschunsgfrage, die Theoire, die daraus abgeleiteten Hypothesen sind. Dazu wären Angaben zum Datensatz (N, Art der Stichprobe, etc.) sinnvoll.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: Bing [Bot] und 20 Gäste