Hallo,
ich benötige dringend Hilfe von Euch.
Ich versuche im Ramen von meiner Hausarbeit einen Index zu bilden und komme nicht weiter.
Folgende Ausgangssituation:
Der Datensatz ist der Allbus 2014
In diesem werden 8 Variablen zu dem Ernährungsverhalten abgefragt, die jeweils von 1 "konsumiere nie" bis 7 "konsumiere täglich" skaliert sind.
Aus diesen 8 Variablen möchte ich nun einen Index bilden, der das Ernährungsverhalten der befragten Person abbildet.
Ich habe nun mehrere Versuche gestartet und bin mittlerweile aber komplett verwirrt.
Ich hatte es zunächst mit folgender Formel versucht:
gen index_ernaehrung =((vollkorn_neu + obst_neu + gemuese_neu + frittiert + fleisch + suesswaren + alkohol + spirituosen) /8
Allerdings stellte sich dann beim tab index_ernaehrung heraus, dass die Werte aufeinmal erst bei einem 2,... Wert angefangen haben.
Ich hätte es aber gerne standardisiert gehabt. Also dass es bei 1 anfängt.
Hatte auch schon Befehle gelesen, bei denen nochmal eine Zahl subtrahiert wurde, aber da bin ich nicht drauf gekommen welche ich da nehmen soll.
Hatte es dann wie folgt probiert:
gen index_ernaehrung =((vollkorn_neu + obst_neu + gemuese_neu + frittiert + fleisch + suesswaren + alkohol + spirituosen)-7) /8
Das hatte ganz gut funktioniert, und es kamen auch Werte ab 1... raus.
Alternativ hatte ich folgenden Befehl versucht:
alpha vollkorn_neu weißbrot_neu obst_neu gemuese_neu frittiert suesswaren fleisch alkohol spirituosen, gen (new_index)
Hier hat es eigentlich gut funktioniert. Der Index fängt bei 1,... an.
Allerdings war ich mir jetzt einfach unsicher, welchen Index ich tatsächlich so verwenden kann.
Da bei den beiden Vorgehensweisen unterschiedliche Werte herauskommen.
Es wäre super, wenn mir da jemand einen Tipp geben könnte.
Vielen Dank schon mal.