Hallo Zusammen,
im Rahmen einer Seminararbeit argumentieren wir, dass verschiedene Diversitätsfaktoren wie Alter, Geschlecht und Education einen positiven Effekt auf die Anzahl der CVC-Deals (Corporate Venture Capital) der Unternehmen hat. Die Anzahl der CVC-Deals ist dabei eine Count-Variable.Für unsere IVs haben wir Klassen gebildet und mittels des Blau Index jeweils für jede Variable den Grad der Diversität berechnet (Berechnung vergleichbar zu Herfindahl), welches in der Literatur eine gängige Methode ist, um Diversity zu messen.
1. Da eine Count-Variable als DV und Overdispersion vorliegen, haben wir in STATA die Negative Binomiale Regression verwendet. Unser Problem ist nun das folgende:
In der Regression kam raus, dass Alter (p=0.00) und Geschlecht (p= 0.001) einen signifikanten Einfluss auf die Anzahl der CVC Deals haben. Die Education (p=0.65) hat keinen signifikanten Einfluss.
Mithilfe einer Korrelation nach Spearman kam jedoch heraus, dass Alter (p=0.015) und Education (p= 0.003) einen signifikanten Einfluss haben und Geschlecht (p=0.54) nicht. Wie kann das sein, dass in der Korrelation etwas nicht signifikant ist und dann in der Regression schon und auch umgekehrt. Haben wir etwas falsch gemacht? Oder sagt bei Count Variablen die Korrelation überhaupt nicht aus.
Bzw. dürfen wir überhaupt ein korrelationskoeffizient wie Spearman oder Kendall’s Tau bei Count Variablen verwenden?
Wir sind sehr irritiert über die gegensätzlichen Ergebnisse und können uns diese nicht erklären.
2. Zudem haben wir in unserer Count Variable eine hohe Anzahl an Nullen, d.h. die Unternehmen haben in dem Jahr kein CVC Deal abgeschlossen. Müssten wir daraufhin die Zero-Inflated Negativ Binomial Regression oder ein Tobit Regression Model anwenden?
Wir sind dankbar jeden Input und jede Hilfe.
LG Vanessa