Hallo zusammen!
Bin nicht sicher, ob das das richtige Forum ist; falls nicht, tut mir leid!
Und zwar muss ich für ein Termpaper ein Dataset norwegischer Firmen bearbeiten. Mein Problem ist, dass dieses Set extrem groß ist und ich nicht weiß, wie ich das sinnvoll komprimieren kann. Es gibt auch viele Missing Values - hat das irgendeine negative Auswirkung auf die Schätzungen? Hab nämlich gelesen, dass Stata Missing Values ignoriert. Ich will zum Beispiel eine neue Variable "wage" bilden, indem ich die gesamten Lohnausgaben durch die Anzahl der Beschäftigten teile - gibt es da Verzerrungen, wenn die Beobachtungen für Lohnausgaben weitaus geringer sind als die der Anzahl der Beschäftigten? Muss ich die Variablen irgendwie so komprimieren, dass für alle die selbe Beobachtungszahl vorliegt?
Für Hilfe wäre ich sehr dankbar!