Hallo zusammen,
ich habe einen Paneldatensatz mit Informationen über Kaufdaten von Retailkunden. Diese Kunden haben 2 Lebenszyklen. Der erste und zweite Lebenszyklus ist in dem Datensatz pro Kundennummer in unterschiedliche Zeilen geschrieben.
Ich brauche jetzt ein Modell, indem ich die Wahrscheinlichkeit des outcome einer Variable aus dem zweiten Lebenszyklus, durch Variablen aus dem ersten Lebenszyklus vorhersagen kann.
Bsp. Anhand von einer gewissen Bestellmenge aus dem ersten Lebenszyklus kann ich schließen, dass der Kunde wahrscheinlich im zweiten Lebenszyklus mehr zurückschickt.
Jemand eine Idee? Im Prinzip muss die abhängige in dem Modell die Variable aus dem zweiten Lebenszyklus sein und die unabhängigen Variablen, die aus dem ersten. Weil die Zeilen aber unterschiedlich sind, funktioniert es aktuell nicht.
Lieben Dank!
Dominik