Hallo zusammen
Ich bin gerade an einer Arbeit über firmenspezifische Auswirkungen auf die Vollkosten von Buslinien. Dabei habe ich einen Paneldatensatz über mehrere Busunternehmen, welche wiederum verschiedene Buslinien betreiben. Ich habe also mehrere x-Variablen, welche für alle Linien eines Busunternehmens gleich sind. Problem: Korrelation der unbeobachtbaren Variablen mit dem Störterm innerhalb eines Clusters. Das Problem wird mittels geclusterten Standardfehlern mit dem Statabefehl ", cluster (clustervar)" gelöst. Meine Frage ist nun aber, wie sich das genau auswirkt, wenn gewisse Unternehmen nur 5 Buslinien haben, andere aber über 30? Muss ich dies irgendwie gewichten?
Ich führe übrigens eine random effects Regression durch.
Vielen Dank für eure Antworten.
gruss titeuf