von djan » Mi 1. Mai 2013, 12:51
Hi Daniel,
ich habe über die Clusterung noch ein wenig nachgedacht und nachgelesen und ich schwanke zwischen zwei Clusterungsarten:
(Zur Erinnerung: Ich habe 5-Minuten Daten für 30 deutsche und 40 französische Unternehmen über 2 Monate hinweg, d. h. pro Unternehmen rund 4400 Beobachtungen)
1. Clusterung auf Unternehmensebene - Pro: Korrelation im gesamten Betrachtungszeitraum, d. h. auch über Handelstage hinweg für ein Unternehmen wird mit einbezogen; Contra: Sehr große Cluster, jeweils 4400 Beobachtungen bei insgesamt ca. 60000-80000 Beobachtungen je Untersuchungsklasse. Dadurch können auch kleinere Korrelationen schon zu einer enormen Beobachtungsanpassung bei der Clusterung führen, d. h. die Regression "zu robust" machen, also (deutlich) größere Standardfehler für die Koeffizienten liefern, als eigentlich angemessen.
2. Clusterung nach Unternehmen und Handelstag - Pro: Kleinere Cluster, oben erwähntes Problem besteht also nicht. Contra: Es wird quasi unterstellt, dass für ein Unternehmen die Beobachtungen nur über den Handelstag hinweg korrelieren, nicht jedoch zwischen den Handelstagen.
Ich neige dazu zweite Möglichkeit zu wählen, da hier a) die Intraklassenkorrelation größer ist b) zu große Cluster das tatsächliche Bild meiner Meinung nach zu negativ darstellen (obwohl die IKK hier geringer ist, sind aufgrund der Clustergröße die Standardfehler viel größer) c) ein anderes Paper, das ein Thema ähnlich dem meinem behandelt, auch nach Unternehmen und Tag geclustert hat. d) Ich meine Ergebnisse konservativ (Alpha = 1%) interpretieren kann zum Ausgleich der Contra-Argumente für die Clusterung nach Unternehmen und Tag.
Bitte gib mir nochmal ein kurzes Feedback.
Grüße