Daten restrukturieren: kniffliges Problem

Fragen zu Stata Syntax und Do-Files.

Daten restrukturieren: kniffliges Problem

Beitragvon bromelius » Di 30. Apr 2013, 09:55

Liebes Forum,

ich sitze derzeit an 3 Excel-Dateien, die ich in ein bestimmtes Format bringen möchte, um sie später zusammen zu fügen.

Die Datei Excel 0 (Beispielaufbau im Bild) werde ich zunächst auf monatliche Daten zusammenfassen. Dafür würde ich das Datum mit

split var1, p(".")

auseinandernehmen und dann mit

collapse (mean) var2, by(monat)

auf monatliche Daten zusammenfassen.

Problem: die Firmennamen und das Jahr verschwinden leider. Wie behalte ich diese und ggf. andere Variable?

Excel 1 enthält in den Zellen nur Informationen zu einer Variable. Die Datenstruktur soll wie Excel 0 sein (also eine Spalte die Firma, dann das Jahr, der Monat und dann die Werte der Variablen), wobei die Quartalswerte für jedes Jahr auf 12 Monate so aufgefüllt werden sollen, dass der Wert aus Q1 in Monat 1, der aus Q2 in Monat 4, Q3 in Monat 7 und Q4 in Monat 10 stehen soll. Hier habe ich leider keine Ahnung wie das geht. Später werden dann die fehlenden Werte interpoliert.

Excel 2 enthält nun in den Spalten pro Firma den Wert einer Variablen. Auch hier soll die Struktur von Excel 0 entstehen. Auch hier habe ich leider keine Idee.

Ich danke im Voraus für die Hilfe.

-Brome
Dateianhänge
Excel 2.png
Excel 2
Excel 2.png (14.99 KiB) 2964-mal betrachtet
Excel1.png
Excel 1
Excel1.png (15.15 KiB) 2964-mal betrachtet
Excel 0.png
Excel 0
Excel 0.png (23.76 KiB) 2964-mal betrachtet
bromelius
 
Beiträge: 43
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten restrukturieren: kniffliges Problem

Beitragvon daniel » Di 30. Apr 2013, 10:55

Die Datei Excel 0 (Beispielaufbau im Bild) werde ich zunächst auf monatliche Daten zusammenfassen. Dafür würde ich das Datum mit

split var1, p(".")

auseinandernehmen und dann mit

collapse (mean) var2, by(monat)

auf monatliche Daten zusammenfassen.

Problem: die Firmennamen und das Jahr verschwinden leider. Wie behalte ich diese und ggf. andere Variable?


Naja, "Problem" ist vielleicht das falsche Wort hier. Wenn Du alle Werte pro Monat aggregierst ohne zu berücksichtigen, dass diese Werte von verschiedenen Firmen kommen, sehe ich nicht, in welchem Verhälnis die Firmennamen -- selbst wenn Du sie behalten würdest -- zu den aggregierten Daten stehen sollen? Kannst Du hier ein reproduzierbares Minibeipsiel erstellen? Ich denke hier spontan in Richtung speichern der Ausgangsadaten und ein anfügen (-merge-) der aggregierten Werte.

Zu Excel1: Nachdem Du die erste Zeile gelöscht hast, sieht das nach einem mehr oder weniger einfachen -reshape- aus.

Zu Excel2: vgl. bitte mal die Threads stata-syntax-f18/groszer-datensatz-renditenberechnung-t353.html und stata-syntax-f18/erste-zeile-aus-excel-wird-nicht-als-variablen-ubernommen-t358-10.html in denen nahezu identische Probleme behandelt werden.
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten restrukturieren: kniffliges Problem

Beitragvon bromelius » Di 30. Apr 2013, 11:08

Ok, dann habe ich es falsch ausgedrückt, auch im Syntax: es soll immer pro Firma aggregiert werden, und: die Daten bei Excel 2 sind so, dass pro Quartal ebenfalls für die Variablen immer gleiche Werte vorliegen, demnach also auch wie bei Excel 1 die Quartale auf 12 Monate gestreckt werden müssten und der konstante Quartalswert immer auf den ersten Monat des Quartals gesetzt werden müsste.

Danke für die Link-Tipps, probiere das mal aus.
bromelius
 
Beiträge: 43
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten restrukturieren: kniffliges Problem

Beitragvon bromelius » Di 30. Apr 2013, 11:34

Noch eine Frage: kann Stata keine hermite polynomial interpolation, speziell bei mir die cubic?
bromelius
 
Beiträge: 43
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Daten restrukturieren: kniffliges Problem

Beitragvon daniel » Di 30. Apr 2013, 11:38

Ein weitere Link: http://www.ats.ucla.edu/stat/stata/faq/ ... onthly.htm

Zur Frage:

Code: Alles auswählen
findit pchipolate
findit  gausshermite
daniel
 
Beiträge: 1060
Registriert: Sa 1. Okt 2011, 17:20
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Stata Syntax

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 9 Gäste

cron