Hallo zusammen,
ich bin gerade auf diesen Eintrag gestoßen und möchte gerne einige Fragen daran anschließen.
Vorweg: Ich beschäftige mich zum ersten Mal mit der Gewichtung in STATA (Version 16.1) und bin leider etwas ratlos. Aktuell arbeite ich mit den Daten aus der GLES Nachwahlbefragung 2013 (ZA5701). In diesem Datensatz sind mehre Gewichtungsvariablen enthalten. (Quelle:
https://search.gesis.org/research_data/ZA5701)
Um die Ergebnisse möglicher Analysen so repräsentativ zu erhalten habe mich für das Gewicht:
„Sozial- und regionalstrukturelles Gewicht, gesamt (mit Trans.-/mit OW-Gewicht)“ entschieden. Dabei handelt es sich um eine Kombination mehrerer Gewichte; allerdings nicht mehr um ein reines
„Designgewicht“. Dieser Befehlsbeschreibung (
https://www.stata.com/help10.cgi?weight) nach würde ich den Befehl
pweight als sample-Gewicht verwenden.
Ist das korrekt? 1. TabellenMir ist aufgefallen, dass es nur geringfügige Unterschiede zwischen den Ergebnissen gibt, wenn ich
pweight und
fweight verwende.
- Code: Alles auswählen
tab geschlecht [fweight= round(w_ipfges_1*100)]
svyset [pweight=w_ipfges_1]
svy: tab geschlecht
![tab.png tab.png](http://www.stata-forum.de/resources/image/191)
- tab.png (178.87 KiB) 5320-mal betrachtet
Die Unterschiede könnten auf die Rundung zurückzuführen sein.
Welchen Unterschied macht die Verwendung der Befehle dann?2. Berechnung von RegressionenWenn ich eine Regression berechne gibt es zwar Unterschiede zwischen den verschiedenen Befehlen zur Gewichtung
pweight und
fweight.
Aber ich kann nicht so richtig einschätzen wie gravierend die unterschiedlichen Befehle sich hier auswirken und ob es tatsächlich einen Unterschied macht pweight oder fweight bei einer Regression zu verwenden?Als Beispiele:
- Code: Alles auswählen
logit wahl2013spd ib0.berufsgruppe [pweight= w_ipfges_1]
![reg_pweight.png reg_pweight.png](http://www.stata-forum.de/resources/image/193)
- reg_pweight.png (187.25 KiB) 5320-mal betrachtet
- Code: Alles auswählen
logit wahl2013spd ib0.berufsgruppe [fweight= round(w_ipfges_1*100)]
![reg_fweight.png reg_fweight.png](http://www.stata-forum.de/resources/image/192)
- reg_fweight.png (184.86 KiB) 5320-mal betrachtet
3. ZusammenhangsmaßeWenn ich nun das Zusammenhangsmaß Cramver‘s V zwischen zwei mit
pweight gewichteten Variablen berechnen möchte erhalte ist dies nicht möglich.
Die Befehle:
- Code: Alles auswählen
tab berufsgruppe gewerkschaftsmitglied [pweight= round(w_ipfges_1*100)], V
tab berufsgruppe gewerkschaftsmitglied [pweight= w_ipfges_1*100], V
… ergeben nur:
pweights not allowedund:
- Code: Alles auswählen
svyset [pweight=w_ipfges_1]
svy: tab berufsgruppe gewerkschaftsmitglied, V
… ergibt:
option V not allowedEinzig der Befehl:
- Code: Alles auswählen
tab berufsgruppe gewerkschaftsmitglied [fweight= round(w_ipfges_1*100)], V
…. liefert ein Ergebnis!
Aber es ist ja eigentlich kein Frequenzgewicht. Wie berechne ich dann mit pweight Cramer's V?Ich hoffe ich konnte meine Fragen und Probleme verständlich erklären und würde mich freuen wenn mir jemand von euch weiterhelfen könnte. Danke!