Regression mit mehreren polytomen kategorialen Variablen

Regressionsmodelle aller Art mit Stata.

Regression mit mehreren polytomen kategorialen Variablen

Beitragvon evagenau » Mi 30. Jun 2021, 11:49

Hallo, ich brauche dringend Hilfe für eine Regression für eine Datenauswertung in meiner Hausarbeit.

Gemessen werden soll der Einfluss von Kontakthäufigkeit (drei Ausprägungen: Seltener, Gleichbleibend, Häuftiger) auf die Lebenszufriedenheit, die Einsamkeit und die depressiven Sympotome einer Person (alle drei mit unterschiedlichen Skalen gemessen, z.B. mit Werten von 0-30).

Da die erstellten Scatterplots wegen der wenigeren Ausprägungen der unabhängigen Variable (Kontakthäufigkeit) nur in drei Linien verteilt sind, frage ich mich, ob ich die Regression einfach durchführen kann, oder ob ich auf etwas bestimmtes achten muss?

Sonst hätte ich eine ganz normale Regression (reg Var1 Var2 ...) durchgeführt.

Für Tipps und Hilfen wäre ich sehr dankbar.

Liebe Grüße

Eva
evagenau
 
Beiträge: 12
Registriert: Mi 30. Jun 2021, 11:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression mit mehreren polytomen kategorialen Variablen

Beitragvon Staxa » Mi 30. Jun 2021, 12:50

Solange deine AV halbwegs ordentlich verteilt ist sollte das kein Problem darstellen. Also etwa:

Code: Alles auswählen
reg zufriedenheit i.kontakt
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 685
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression mit mehreren polytomen kategorialen Variablen

Beitragvon evagenau » Do 1. Jul 2021, 14:18

Vielen Dank für die schnelle Hilfe, die Variablen sind meistens etwas links- oder rechtsschiefverteilt bei z.b. Lebenszufriedenheitswerten. Aber ich schätze das sollte ja kein Problem darstellen.

Danke!!
evagenau
 
Beiträge: 12
Registriert: Mi 30. Jun 2021, 11:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression mit mehreren polytomen kategorialen Variablen

Beitragvon evagenau » Do 15. Jul 2021, 17:12

Hallo nochmal zu dem, bzw. einem verwandten Thema. Ich habe eine Variable, die die Corona -Infektion beschreibt. Diese ist mit drei Ausprägungen verteilt (Ja, Nein, Weiß nicht). Wenn ich diese jetzt als unabhängige Variable auf den Einfluss auf zb. die Lebenszufriedenheit untersuchen möchte, klappt das nicht einfach so oder?

Man kann ja den Beta-Koeefizienten dann schlecht interpretieren, hab ich recht? Normalerweise heißt es ja, wenn VarX (unabhängig) um eine Einheit steigt, steigt VarY (abhängig um ...). Hier lässt sich das ja nicht so verallgemeinern, da es sich um keine normale Skala handelt.

Für Hilfe wäre ich sehr dankbar! Viele Grüße!!
evagenau
 
Beiträge: 12
Registriert: Mi 30. Jun 2021, 11:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression mit mehreren polytomen kategorialen Variablen

Beitragvon Staxa » Fr 16. Jul 2021, 09:18

Solange deine AV metrisch ist sollte das kein Problem sein. Die Regression ist dann etwa so:


Code: Alles auswählen
reg zufriedenheit i.corona_status


Wichtig ist hier, wie die Corona-Var kodiert ist. Stata setzt dann eine Referenzkategorie, diese hat dann den niedrigsten numerischen Wert. Also z.B. wenn "kein Corona" den Code 0 hat und "Corona" den Wert 1, so wäre kein Corona die Referenz. Angezeigt wird dir dann der Effekt für alle anderen Kategorien. Ist dieser Koeffizient beispielsweise -5 für Corona, so heisst das, dass Leute die Corona haben eine um fünf Punkte geringere Zufriedenheit haben als Leute ohne Corona (also die Referenz). Mehr Infos sind z.B. im Buch in meiner Signatur gelistet.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 685
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression mit mehreren polytomen kategorialen Variablen

Beitragvon evagenau » Do 29. Jul 2021, 08:28

Vielen Dank erstmal für die Hilfe. Problematisch ist hier für mich vor allem, wie ich mit der Kategorie "Weiß nicht" umgehen kann. Die Ausprägungen der Variable wurden wie folgt angeliefert:

lt | Freq. Percent Cum.
------------+-----------------------------------
1 | 8 0.21 0.21
2 | 3,709 95.22 95.43
8 | 178 4.57 100.00
------------+-----------------------------------
Total | 3,895 100.00

Wobei 1 = Infektion, 2 = Keine Infektion und 8 = Weiß nicht. Ich muss ja wahrscheinlich das Label bei der 8 erstmal zu einer 3 umkodieren, damit die Abstände gleich sind, richtig? Und danach kann die Regression mit der Lebenszufriedenheit erst interpretieren oder?
evagenau
 
Beiträge: 12
Registriert: Mi 30. Jun 2021, 11:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression mit mehreren polytomen kategorialen Variablen

Beitragvon Staxa » Do 29. Jul 2021, 09:54

Nein, in diesem Falle ist das unerheblich. Im Prinzip tut deine Regression nur Mittelwerte nach diesen Kategorien getrennt berechnen. Das kannst du so einfach nachvollziehen:


Code: Alles auswählen
reg zufriedenheit i.corona_status
margins corona_status


Dafür ist es unerheblich, wie die erklärende Variable Status kodiert ist, solange du das Präfix i. benutzt. Da du aber offenbar nur 8 Leute mit einer Infektion hast wird das sowieso sehr unsicher sein, die Fallzahl ist ja extrem niedrig.
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 685
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression mit mehreren polytomen kategorialen Variablen

Beitragvon evagenau » Fr 30. Jul 2021, 09:51

-------------------------------------------------------------------------------
lz_alt | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------------+----------------------------------------------------------------
infektion_alt |
2 | .5728734 .2435663 2.35 0.019 .0953417 1.050405
8 | .4097458 .2487381 1.65 0.100 -.0779256 .8974171
|
_cons | 3.325 .2433006 13.67 0.000 2.847989 3.802011
-------------------------------------------------------------------------------

-------------------------------------------------------------------------------
| Delta-method
| Margin Std. Err. t P>|t| [95% Conf. Interval]
--------------+----------------------------------------------------------------
infektion_alt |
1 | 3.325 .2433006 13.67 0.000 2.847989 3.802011
2 | 3.897873 .0113749 342.67 0.000 3.875572 3.920175
8 | 3.734746 .0517251 72.20 0.000 3.633334 3.836157


Okay danke schon mal. Ich hab mal so eine Regression durchgeführt und folgende Ergebnisse bekommen (Ich hoffe man kann es lesen). Um das jetzt mal zu interpretieren, wäre der Einfluss insofern signifikant, dass mit keiner Infektion die Lebenszufriedenheit um 0.5728734 steigt? Oder habe ich das falsch verstanden?
evagenau
 
Beiträge: 12
Registriert: Mi 30. Jun 2021, 11:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression mit mehreren polytomen kategorialen Variablen

Beitragvon Staxa » Fr 30. Jul 2021, 09:57

Ja, also Personen, die keine Infektion haben, haben eine um 0.57 Punkte höhere Lebenszufriedenheit als Personen mit Infektion (die mit Infektionen sind die Referenzkategorie).

Unten siehst du dann jeweils die Mittelwerte pro Gruppe (3.325 / 3.89 / 3.73).
Stata für Anfänger: www.statabook.com
Staxa
 
Beiträge: 685
Registriert: Di 27. Feb 2018, 12:56
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Regression mit mehreren polytomen kategorialen Variablen

Beitragvon evagenau » Fr 30. Jul 2021, 10:08

Cool, danke das hat mir sehr geholfen! :) Aber du meintest es wäre eher eine unsichere Regression, weil die Verteilung so ungleich ist?
evagenau
 
Beiträge: 12
Registriert: Mi 30. Jun 2021, 11:37
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Nächste

Zurück zu Regressionsmodelle

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron