Propensity score matching

Regressionsmodelle aller Art mit Stata.

Re: Propensity score matching

Beitragvon Annerika » Mo 6. Jan 2014, 17:53

Wichtig

Sorry mein Fehler: Im Einkommensmodul wurde jede Einkommensart einzeln angegeben sprich zB. Work: 100 $ Rente: 40$ Einnahmen aus Vermietung: 30$ Remitt: 19$ dh ich kann genau die Höhe der Remitt aus Einkommensmodul herauslösen.....wie gesagt sorry das hatte ich vergessen anzugeben.

Also:

aus 1 Remitt aus Einkommensmodul (ohne Relevanz von wem die Remitt sind) in metrischer Form

aus 2 Remitt aus Migrationsmodul (Remitt von echten HH MIgranten) auch in metrischer Form

Sorry mein Fehler das nicht erwähnt zu haben
Annerika
 
Beiträge: 24
Registriert: Di 17. Dez 2013, 19:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Propensity score matching

Beitragvon daniel » Mo 6. Jan 2014, 19:50

Also:

aus 1 Remitt aus Einkommensmodul (ohne Relevanz von wem die Remitt sind) in metrischer Form

aus 2 Remitt aus Migrationsmodul (Remitt von echten HH MIgranten) auch in metrischer Form


Ich verstehe nicht, wesshalb Du immer noch auf den Unterschied zwischen "ohne Relevanz von wem die Remitt sind" und "Remitt von echten HH MIgranten" eingehst? ich dachte per Annahme wäre es immer ohne Relevanz von wem die Remitt sind -- völlig unabhängig vom Modul. Du willst Remmit in metrischer Form -- für alle Haushalte im Datensatz. Fertig.

Du hast doch später nur zwei Variablen: 1. migrantenhauhalt (ja/nein) 2. Höhe der Remitt. Woher die Remits kommen weißt Du dann ohenhin nicht mehr bzw. willst Du nicht wissen. Ansonsten wird das Modell in der Tat ein gutes Stück komplexer, und ich dachte, genau das wolltest Du vermeiden.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Propensity score matching

Beitragvon Annerika » Mo 6. Jan 2014, 20:09


Ich verstehe nicht, wesshalb Du immer noch auf den Unterschied zwischen "ohne Relevanz von wem die Remitt sind" und "Remitt von echten HH MIgranten" eingehst? ich dachte per Annahme wäre es immer ohne Relevanz von wem die Remitt sind -- völlig unabhängig vom Modul. Du willst Remmit in metrischer Form -- für alle Haushalte im Datensatz. Fertig.


Hm sorry das ich mich da so unglücklich ausgedrückt habe. Aber ich denke es ist von entschiedener Relevanz von woher die Remitt kommen.

Kontrolliere ich auf Migrationshaushalte ja/nein und Remitt in metrischer Angabe kann ich doch erkennen, dass wenn bei Migration ja ist, die Remitt von Migrant kommen und wenn nein ist, das Remitt von extern kommen müssen

Wie gesagt für den seltenen Fall
HH hat Migrant der keine Remitt schickt erhält aber Remitt über soziales Netzwerk kann ich nicht kontrollieren....diese Fälle landen dann leider mit bei yMyR

Du hast doch später nur zwei Variablen: 1. migrantenhauhalt (ja/nein) 2. Höhe der Remitt. Woher die Remits kommen weißt Du dann ohenhin nicht mehr bzw. willst Du nicht wissen. Ansonsten wird das Modell in der Tat ein gutes Stück komplexer, und ich dachte, genau das wolltest Du vermeiden.


Nee ich kann ja bestimmen ob Migrantionshaushalt Remitt hat bzw Nichtmigrationshaushalt welche bekommt (zumindestens in den meisten Fällen)

Daher qualmt mir ja der Kopf so weil es eben relevant ist wer die Remitt schickt und komme ich beim Modellbau nicht weiter.
Annerika
 
Beiträge: 24
Registriert: Di 17. Dez 2013, 19:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Propensity score matching

Beitragvon daniel » Mo 6. Jan 2014, 22:38

Also entweder wir schreiben aneinander vorbei, oder Du hast wirklich gerade einen starken Koten im Kopf, oder ich verstehe das Problem nicht. Für mich ist die Sache extrem einfach. Du hast in Deinem Datensatz esentiell drei Variablen. Eine Haushalts Id, um die Haushalte zu identifizieren. Eine Variable sollte die (prp Kopf) Höhe der Remittances enthalten. Vom 0 bis Max. Eine letzte Variable gibt an, ob es sich um einen Haushalt mit Migrant handelt (Wert 1) oder nicht (Wert 0).

Um Deine Forschungsfrage zu beantworten schätzt Du das Modell

SWB = b1*Remittances + b2*Migrationshaushalt + b3*Remittances*Migrationshaushalt

Das wars. b1 ist der durchschnittliche Effekt eines Dollars Remittance für Haushalte, in denen niemand migriert ist, b2 ist der Effekt den eine Migration im Haushalt hat, wenn keine Remittances geschickt werden, b3 schätzt den Effekt der Wechselwirkung zwischen beiden. Der Koeffizient gibt an wieviel mehr oder weniger ein Dollar die SWB beeinflusst, falls ein Haushaltsmitglied migriert ist, oder um wieviel der Effekt eines migrierten Haushaltsmitglieds sich pro Dollar Remittance verändert.

Wo liegt Dein Problem?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Propensity score matching

Beitragvon Annerika » Mi 8. Jan 2014, 14:46

Danke erneut für deine Antwort Daniel!!!

Sorry das ich nochmal nachhacke auch für den Fall das du mich aus dem Forum schmeißt:-)

Den Fall yMyR_but not from the migrant habe ich bisher nicht mitgedacht- danke für diese Ergänzung
Dieser Fall geht bei mir in yMyR "unter" (was ich im Text schreiben könnte da aber nur. 150 Migranten schicken keine Remitt an HH daher der Fall das HH trotzdem Remitt bekommt über Netzwerk ist max 150 eher kleiner...ich werde nochmal sehen ob ich die Fälle rausfischen kann um Ausmass abzusehen)

Grundsätzlich:
Unsere beiden Modelle unterscheiden sich nicht:

Meins: SWB= i.left_behind c. Remitt i.left_behind#c.Remitt [left_behind = Migrationshaushalt ja/nein]

Deins: SWB = b1*Remittances + b2*Migrationshaushalt + b3*Remittances*Migrationshaushalt

Dein und mein Modell bilden die 4 Fälle yMyR yMnR nMyR nMnR ab

Daher neuer Vorstoß: um evt. den Fall yMyR_but not from the migrant noch im Modell aufzunehmen.

Ich könnte das Modell mit zwei Remitt Variablen bauen ZB:

Remitt_Member (Remitt geschickt von migrierten HH Membern)
Remitt_Non_Member (Remitt erhalten aus sozialem Netzwerk KEINE HH Member)

SWB= c.Remitt_Member c.Remitt_Non_Member i.left_behind c.Remitt_Member#i.left_behind c.Remitt_Non_Member#i.left_behind (plus Kontrollvariablen)



SWB=
Annerika
 
Beiträge: 24
Registriert: Di 17. Dez 2013, 19:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Propensity score matching

Beitragvon daniel » Mi 8. Jan 2014, 16:03

Ok, ganz kurz zu Stata

Code: Alles auswählen
i.left_behind c. Remitt i.left_behind#c.Remitt


und

Code: Alles auswählen
i.left_behind##c.Remitt


sind identisch.

Lass mich die Notation im Modell verändern, und explizit Koeffizienten einführen, sodass die Interpretation direkt mitgedacht werden kann.

Es sei
i.left_behind (M)
c.Remitt_Member (Rm)
c.Remitt_Non_Member (Rn)

Dein Modellvorschlag lautet also

SWB = b0 + b1*Rm + b2*Rn + b3*M + b4*Rm*M + b5*Rn*M

In der Tat bildest Du damit alle gewünschten Gruppen ab

yMyR = b0 + b1 + b2 + b4
yMnR = b0 + b3
nMyR = b0 + b2
nMnR = b0

yMyR_but_not_sent_from_the_migrant = b0 + b2 + b3 + b5


Ich sehe da dennoch gewisse Probleme, von denen ich mir nicht sicher bin, wie gravierend sie sind. Zunächst bildest Du (ungewollt) eine weitere Gruppe mit dem Modell ab:

yMyR_not_sent_from_the_migrant_yMyR = b0 + b1 + b2 + b3 + b4 + b5

Hier stellst sich bereits die Frage, ob es diese Gruppe gibt, bzw. wie weit Du mit diesem Modell über die beobachteten Fälle extrapolierst.

Kern dieses und der weiteren Probleme, ist die Beziehung zwischen Rm, M und Rn, die u.A. besagt, dass aus Rm > 1 direkt M = 1 folgt. Das wirft die Frage nach der Interpretation des konditioanlen Effektes b1 auf. Wie interpretierst Du diesen Koeffizienten? Das wäre der Effekt eines Dollars Remittance, den ein Migrant schickt, für den Fall, dass es sich nicht um einen Migrationshaushalt handelt. Diese Konstellation ist nicht möglich.

Eine weitere frage, die sich in diesem Zusammehang stellt, ist die nach der Bedeutung des Unterschiedes zwischen b1 und b2. Da b1 nur für Migrantionshaushalte steht (vgl. vorheriges Argument) bildest die Differenz zwischen b1 und b2 doch bereist einen Teil des Interessierenden Effektunterschieds zwischen einem Dollar Remittance zwischen Migrationshaushalten und Nichtmigrationshaushalten ab, oder?

Direkt anschließend darf man fragen, was es denn mit b5 auf sich hat. Wieso sollte der Effekt von Remittances, die nicht von einem Migranten geschickt werden zwischen Migranten und Nichtmigrationshaushalten varrieren? Das wäre nur Konsequent aus der Logik der Übersetzung des "einfachen" Modells, in dem dieser Fall in die eine Wechselwirkung absorbiert wird. Aber ist das theoretisch sinnvoll?
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Propensity score matching

Beitragvon Annerika » Mi 8. Jan 2014, 17:21

Dank erneut das du dich so in die Thematik reinlegst. Ich ziehe meinen Hut.

Gut dann lieber einfach:

Ich habe nur eine Remitt Variable (Aufsummierung aus Einkommensmodul und Migrationsmodul ohne Doppelungen)

Dh ich kann nicht erkennen woher die Remitt kommen (deine Worte)

Rm > 1 direkt M = 1 folgt

gilt nicht mehr

Ich bleibe beim KISS Modell

b1*Remittances + b2*Migrationshaushalt + b3*Remittances*Migrationshaushalt

Was aber wenn alle 3 Variablen (wie in meinem Fall) keine sign. p Wert erreichen. Wie soll ich das interpretieren (auch nach der Lektüre deines Tipps zu Moderationseffekten leuchtet das mir nicht ein- wenn kein interpretierbarer p-Wert erreicht wird?
Annerika
 
Beiträge: 24
Registriert: Di 17. Dez 2013, 19:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Propensity score matching

Beitragvon daniel » Mi 8. Jan 2014, 18:23

Naja, wenn die Wechselwirkung statistisch nicht signifikant ist, kannst Du eine solche eben nicht nachweisen. Das kann an der "Vermischung" der Gruppen liegen -- muss aber nicht. Nach diesem Ergebnis würdest Du eher das (kleinere, additive) Modell ohne Interaktion interpretieren. Da Du ja keine Wechselwirkung nachweisen kannst, sind die Signifikanztests der konditinalen Effekte in diesem Modell eher irrelevant. Gibt es denn Haupteffekte der Variablen im Modell

SWB = b0 +b1*R + b2*M
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Propensity score matching

Beitragvon Annerika » Do 9. Jan 2014, 19:32

Lieber Daniel.

Danke für deine Erleuchtung. Ich hab das ganze nochmal sacken gelassen und bin auf folgendes gekommen.

c.R kontinuierliche Remittances per capita ohne angabe woher die Rem kommen
M Dummy Migraionshaushalt
D_R_eigene Dummy für eigene Remitt (send by HH Migrant)
D_R_fremd Dummy für fremde Remitt (send not by the HH Migrant)
D_R_beide Dummy für eigene und fremde Remitt (send by HH MIgrant und not send by HH Migrant)

SWB = b0 + b1*c.R + b2*M + b3*D_R_eigene + b4*D_R_fremd + b5*D_R_beide +b6*c.R*M+ b7*c.R*D_R_eigene+ b8*c.R*D_R_fremd + b9* c.R.*D_R_beide

dh ich habe nicht mehr die problematische Aussage

Remitt Migrannt > 1 direkt M = 1
Annerika
 
Beiträge: 24
Registriert: Di 17. Dez 2013, 19:10
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Propensity score matching

Beitragvon daniel » Fr 10. Jan 2014, 01:34

Das sieht nach einem plausiblen Vorschlag aus. Abgesehen von b1, der jetzt den Effekt eines Dollars Remitt schätzt, das von niemandem geschickt wird. Aber ob das worklich eon Problem ist, weiß ich auch nicht genau.
Stata is an invented word, not an acronym, and should not appear with all letters capitalized: please write “Stata”, not “STATA”.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

VorherigeNächste

Zurück zu Regressionsmodelle

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron