STATA-FORUM.DE

Holly_Short_1 · von **Holly_Short_1** » Do 27. Mai 2021, 11:29

Hallo,

ich benötige dringend Hilfe von Euch.

Ich versuche im Ramen von meiner Hausarbeit einen Index zu bilden und komme nicht weiter.
Folgende Ausgangssituation:
Der Datensatz ist der Allbus 2014
In diesem werden 8 Variablen zu dem Ernährungsverhalten abgefragt, die jeweils von 1 "konsumiere nie" bis 7 "konsumiere täglich" skaliert sind.
Aus diesen 8 Variablen möchte ich nun einen Index bilden, der das Ernährungsverhalten der befragten Person abbildet.
Ich habe nun mehrere Versuche gestartet und bin mittlerweile aber komplett verwirrt.

Ich hatte es zunächst mit folgender Formel versucht:
gen index_ernaehrung =((vollkorn_neu + obst_neu + gemuese_neu + frittiert + fleisch + suesswaren + alkohol + spirituosen) /8

Allerdings stellte sich dann beim tab index_ernaehrung heraus, dass die Werte aufeinmal erst bei einem 2,... Wert angefangen haben.
Ich hätte es aber gerne standardisiert gehabt. Also dass es bei 1 anfängt.
Hatte auch schon Befehle gelesen, bei denen nochmal eine Zahl subtrahiert wurde, aber da bin ich nicht drauf gekommen welche ich da nehmen soll.
Hatte es dann wie folgt probiert:
gen index_ernaehrung =((vollkorn_neu + obst_neu + gemuese_neu + frittiert + fleisch + suesswaren + alkohol + spirituosen)-7) /8
Das hatte ganz gut funktioniert, und es kamen auch Werte ab 1... raus.

Alternativ hatte ich folgenden Befehl versucht:
alpha vollkorn_neu weißbrot_neu obst_neu gemuese_neu frittiert suesswaren fleisch alkohol spirituosen, gen (new_index)
Hier hat es eigentlich gut funktioniert. Der Index fängt bei 1,... an.

Allerdings war ich mir jetzt einfach unsicher, welchen Index ich tatsächlich so verwenden kann.
Da bei den beiden Vorgehensweisen unterschiedliche Werte herauskommen.

Es wäre super, wenn mir da jemand einen Tipp geben könnte.
Vielen Dank schon mal.

Staxa · von **Staxa** » Do 27. Mai 2021, 13:52

Ganz grundsätzlich bin ich recht ratlos, was der Index nun genau messen soll. Hier werden sehr verschiedene Produkte zusammengeworfen (Alkohol, also schlecht, Gemüse, also gesund?). Was bedeutet dann eine Zahl? Also wenn jemand einen Wert von 5.5 hat? Was sagt uns das dann? Dass er ein guter Konsument ist? Das wäre inhaltlich zunächst zu erklären. Was soll der Index denn abbilden und in welchen Analysen soll er genutzt werden?

Holly_Short_1 · von **Holly_Short_1** » Fr 28. Mai 2021, 08:44

Hey,

tut mir leid, das hätte ich vielleicht noch dazu schreiben sollen.

Also die "gesunden" Lebensmittel wie Obst, Gemüse, Vollkorn... habe ich bereits umkodiert.
Sodass die Skala einen Sinn gibt.
Inhaltlich soll der Index daher anzeigen ob jemand sich eher ungesund oder gesund ernährt.

Das ganze dient dann als Kontrollvariable in einer lin. Reg., die abhängige Variable soll der "BMI" und die unabhänige Variable der "soziale Status" sein.

Liebe Grüße und schon mal vielen Dank !

Staxa · von **Staxa** » Fr 28. Mai 2021, 10:38

In dem Fall wäre alpha sicher der einfachste Weg. Hier solltest du dann eben den Wert kontrollieren (er sollte größer als 0.7 sein) und dir die Verteilung anschauen, vielleicht mit histogram. Dann kannst du die Variable so verwenden. Insgesamt machst du hier nur eine lineare Transformation, was die absoluten Werte ändern kann, aber deine Korrelationen usw... sollte das nicht beeinflussen.

STATA-FORUM.DE

Index_bilden

Index_bilden

Re: Index_bilden

Re: Index_bilden

Re: Index_bilden

Wer ist online?