Hi allerseits,
ich habe fogendes Problem mit dem merge command und wäre SEHR dankbar für etwas Hilfe.
Ich habe viele versch. data sets. Manche basieren aus Haushalt´s data, d.h. jeder Haushalt hat eine ID Nummer zugeordet.
Manche basieren auf data von individuellen Menschen, diese haben dann jeweils innerhalb ihres Haushaltes eine ID Nummer, z,b im Haushalt 202 gibt es 5 Mitglieder, nummeriert von 1-5.
Nun habe ich einen merge von 2 individ. data sets ausgeführt, hat super geklappt, ich hab mit der Haushaltsvariabel und mit der ID der jeweiligen Person gemerged. Alles gut soweit.
Nun musste ich aber dieses neu entstandene Set mit einem Dritten, diesmal einem Haushalts Set mergen.
Wenn ich dies mit der Variabel hhid (Haushalts ID) tue (und nur diese ist in beiden Sets identisch), dann scheint auch erstmal alles gut.
Ich nutze:
merge m:1 hhid using data2
Ich bekomme auch ein 100% (3) match.
ABER.. um zu sehen, ob mein merge wirklich erfolgreich war, habe ich einen einfachen Test gemacht (der laut meiner Logik Sinn machen sollte?).
Ich hab den Durchschnittswert einer Variabel (hier Einkommen) berechnet. Einmal im neuen, ge-meregden Set und einmal vorher, before ich die 3te Datei gemerged hab.
Die Werte sind anders. Mein Durchschnitt scheint sich verändert zu haben, was er aber logisch gesehen doch nicht passieren sollte? Das Durchschnittseinkommen sollte doch gleich bleiben, da ich ja immernoch die selben Haushalte habe!?
Ich weiß nicht , ob ich hier nen ganz doofen Denkfehler hab, aber ich weiß nicht weiter.
Hat jemand nen TIpp, was hier los ist?
Vielen Dank
Vijo