Hi zusammen,
ich bin Neuling bei Stata und habe eine Frage.
Ursprünglich hatte ich einen Datensatz mit Insidertrades im Zeitraum von 2002-2013 von Managern deutscher Unternehmen mit den folgenden Variablen:
wkn, Datum des Trades, Trader (Manager), Transaktion (Kauf oder Verkauf), Anzahl an Aktien, Preis und Volumen.
Meine Aufgabe ist es, zu zeigen, dass diese Manager fortdauernd (persistently) überoptimistisch agieren.
Daür habe ich den Datensatz etwas umgestellt, indem ich nach Trader und Jahr des Trades sortiert habe.
Optimismus will ich folgendermaßen messen: Wenn ein Manager über seinen gesamten Tradingzeitraum in mehr Jahren ein Nettokäufer (in Bezug auf die Anzahl an Aktien war) als er ein Nettoverkäufer war, dann wird er als fortdauernd optimistisch eingestuft, indem er durch eine Dummyvariable die Zahl 1 bekommt. Wenn er in mehr Jahren ein Nettoverkäufer war, erhält er entsprechend eine -1.
Nun will ich in einer Regressionsanalyse den Einfluss mehrer Balance sheet Daten (Total assets, Tobin's Q, Industriecode) auf Optimismus (als abhängige Variable) untersuchen.
Ich habe auch schon die Balance sheet Variablen mit meinem Datensatz gematcht, das heißt jedem Unternehmen wurde für jedes Jahr der entsprechende Wert (z.B. für Total Assets) zugeordnet. Allerdings weiß ich nun nicht, wie das mit der Regression funktioniert, da ich ja pro Unternehmen erstens mehrere Manager und zweitens mehrere Jahre vorliegen habe. Ich weiß also nicht, wie ich diese zusätzlichen Daten nun sinnvoll integrieren kann, damit ich keine Duplikate habe.
Würde mich über schnelle Hilfe sehr freuen!
Vielen Dank im Voraus!
LG,
Yannick