Ich weiß, ich kann nur meckern, aber leider ist der Datensatz nicht im geringsten hilfreich. Es gibt lediglich 9 Fälle und zwei Frimen, von denen kein einziger als Kontrollgruppe in Frage kommt (Eventfirm ist entweder 1 oder fehlt). Zudem variert Eventdate nicht, was es schwer macht, zu erahnen, was genau Du mit
das matching soll nur in einem bestimmten Monat geschehen (der aber wiederum für jedes Unternehmen unterschiedlich ist)
meinst, und nach welchen Kriterien dieser Monat für welches Unternehmen festgelegt wird. Die Variablen EJahr und EMonat sind mir schleierhaft, da hier lediglch die Informationen enthalten sind, die bereits in Eventdate stehen. Weiter Variablen, wie Monat, die (a) in keinem nachvollziehbaren Zusammenhang zu den restlichen Angaben stehen, und (b) für Dein Problem (verutlich) irrelavant sind, sollten natürlich auch nicht im Beispieldatensatz auftauchen.
Des Weiteren kann Dir nicht
egal [sein] wie der Datensatz hinter her aussehen soll...
Es geht hier nämlich weniger um Deine ästhetischen Vorstellungen, sondern darum ob das, was Du willst, überhaupt in einer Datenmatrix darstellbar und daher auch berechnbar ist. Als Beispiel: häufig wollen Leute z.B. einzelne Fälle einzelner Variablen "löschen". Das käme einem Löschen einzelner Zellen in der Datenmatrix gleich -- was schlichtweg unmöglich ist. Du solltest also eine ziemlich exakte Idee davon haben, wie die Datenmatrix, auf der Du Deine Berechnungen basieren willst aussehen wird.
Zumindest solltest Du bereist jetzt in der Lage sein, das oder die Analyse Befehle aufzuschreiben, die Du verwenden willst. Ohne diese Information, besteht eine hohe Wahrscheinlichkeit viel Aufwand in eine unnötige Datenaufbereitung zu stecken.
Hast Du mal genauer in -psmatch2- reingeschaut, und Dich mit propensity score matching befasst? Ich bin mir gar nicht sicher, ob hier eine Datenaufbereitung, wie Du sie im Sinn hast, wirklich sinnvoll ist.
Was wäre mit einem Ansatz der Richtung
- Code: Alles auswählen
psmatch2 Eventfirm MV MVTB
verkehrt?