STATA-FORUM.DE

Schirmer · von **Schirmer** » Fr 25. Nov 2022, 16:48

Hallo zusammen,

ich habe eine Frage bzgl. Ergebnisse, die ich im Rahmen einer Panel Regression erhalten habe.
Mein Panel besteht aus Daten zu den EU27 Ländern in den Jahren 2015-2020.

Ich möchte untersuchen, inwiefern die Nutzung von IT eine Auswirkung auf die Profitabilität und das Risiko von Banken hat.
Was mich bei meinen Ergebnis absolut überrascht, ist der extrem hohe r² Wert von 0,98(!). Vielleicht könnte sich jemand von euch kurz meine Syntax anschauen und mir sagen, ob hier ein grober logischer Fehler vorliegt. Ein solch gutes Ergebnis ist für mich eher ein Indiz für einen Fehler in der Vorbereitung der Regression.

Für meine Panelanalyse habe ich folgende Syntax verwendet:

. xtset IDCountry Year, yearly

Panel variable: IDCountry (strongly balanced)
Time variable: Year, 2015 to 2020
Delta: 1 year

. xtreg ZScore Broadband CIR NPL DomesticCredit GDP, fe vce(robust)

Fixed-effects (within) regression Number of obs = 157
Group variable: IDCountry Number of groups = 27

R-squared: Obs per group:
Within = 0.1464 min = 4
Between = 0.0015 avg = 5.8
Overall = 0.0003 max = 6

F(5,26) = 5.25
corr(u_i, Xb) = -0.1193 Prob > F = 0.0018

(Std. err. adjusted for 27 clusters in IDCountry)
--------------------------------------------------------------------------------
| Robust
ZScore | Coefficient std. err. t P>|t| [95% conf. interval]
---------------+----------------------------------------------------------------
Broadband | .1829742 .0975818 1.88 0.072 -.0176081 .3835565
CIR | -4.09724 2.392411 -1.71 0.099 -9.014911 .8204315
NPL | 4.59432 4.684873 0.98 0.336 -5.035573 14.22421
DomesticCredit | -1.162399 1.245498 -0.93 0.359 -3.722556 1.397758
GDP | 11.21303 3.945684 2.84 0.009 3.102558 19.3235
_cons | 12.78735 4.227102 3.03 0.006 4.098422 21.47629
---------------+----------------------------------------------------------------
sigma_u | 11.097353
sigma_e | 1.3084709
rho | .98628824 (fraction of variance due to u_i)
--------------------------------------------------------------------------------

.

Den extrem hohen R²-Wert erhalte ich ebenfalls mit dieser Syntax:

. . regress ZScore Broadband i.IDCountry CIR NPL DomesticCredit GDP, vce(robust)

Linear regression Number of obs = 157
F(31, 125) = 504.89
Prob > F = 0.0000
R-squared = 0.9878
Root MSE = 1.3085

Ist diese Syntax in der Theorie korrekt, oder sollte ich diese anders aufbauen?

Ganz liebe Grüße

Staxa · von **Staxa** » Sa 26. Nov 2022, 00:29

Ohne die Daten zu kennen erscheint es schwierig hier konkret etwas auszusagen. Hast du dir mal eine Korrelationstabelle aller Variablen angeschaut. Kann es sein, dass deine AV irgendwie so gebildet wurde, dass sie direkt aus einer der UVs entsteht? Ich würde mir auch nochmal die normale Regression im Detail mit dem ganzen Output anschauen. Ansonsten noch das Paket domin nutzen um zu schauen, welche deiner Variablen letztlich für diesen Effekt verantwortlich ist. Irgendwie komisch, dass in deinem Modell keine der UVs einen wirklich hohen t-Wert aufweist.

STATA-FORUM.DE

Zu gute Ergebnisse

Zu gute Ergebnisse

Re: Zu gute Ergebnisse

Wer ist online?