Hallo zusammen,
ich habe eine Frage bzgl. Ergebnisse, die ich im Rahmen einer Panel Regression erhalten habe.
Mein Panel besteht aus Daten zu den EU27 Ländern in den Jahren 2015-2020.
Ich möchte untersuchen, inwiefern die Nutzung von IT eine Auswirkung auf die Profitabilität und das Risiko von Banken hat.
Was mich bei meinen Ergebnis absolut überrascht, ist der extrem hohe r² Wert von 0,98(!). Vielleicht könnte sich jemand von euch kurz meine Syntax anschauen und mir sagen, ob hier ein grober logischer Fehler vorliegt. Ein solch gutes Ergebnis ist für mich eher ein Indiz für einen Fehler in der Vorbereitung der Regression.
Für meine Panelanalyse habe ich folgende Syntax verwendet:
. xtset IDCountry Year, yearly
Panel variable: IDCountry (strongly balanced)
Time variable: Year, 2015 to 2020
Delta: 1 year
. xtreg ZScore Broadband CIR NPL DomesticCredit GDP, fe vce(robust)
Fixed-effects (within) regression Number of obs = 157
Group variable: IDCountry Number of groups = 27
R-squared: Obs per group:
Within = 0.1464 min = 4
Between = 0.0015 avg = 5.8
Overall = 0.0003 max = 6
F(5,26) = 5.25
corr(u_i, Xb) = -0.1193 Prob > F = 0.0018
(Std. err. adjusted for 27 clusters in IDCountry)
--------------------------------------------------------------------------------
| Robust
ZScore | Coefficient std. err. t P>|t| [95% conf. interval]
---------------+----------------------------------------------------------------
Broadband | .1829742 .0975818 1.88 0.072 -.0176081 .3835565
CIR | -4.09724 2.392411 -1.71 0.099 -9.014911 .8204315
NPL | 4.59432 4.684873 0.98 0.336 -5.035573 14.22421
DomesticCredit | -1.162399 1.245498 -0.93 0.359 -3.722556 1.397758
GDP | 11.21303 3.945684 2.84 0.009 3.102558 19.3235
_cons | 12.78735 4.227102 3.03 0.006 4.098422 21.47629
---------------+----------------------------------------------------------------
sigma_u | 11.097353
sigma_e | 1.3084709
rho | .98628824 (fraction of variance due to u_i)
--------------------------------------------------------------------------------
.
Den extrem hohen R²-Wert erhalte ich ebenfalls mit dieser Syntax:
. . regress ZScore Broadband i.IDCountry CIR NPL DomesticCredit GDP, vce(robust)
Linear regression Number of obs = 157
F(31, 125) = 504.89
Prob > F = 0.0000
R-squared = 0.9878
Root MSE = 1.3085
Ist diese Syntax in der Theorie korrekt, oder sollte ich diese anders aufbauen?
Ganz liebe Grüße