Home

SPSS Trends™ 16

image

Contents

1. 16242 813 370 153 454 831 252 087 529 734 501 571 636 729 532 062 451 489 492 876 2370 483 287 035 93 036 Sinus Kosinus H ufigkeit Transformation Transformation Periodogramm 000 828131182 146743038 110970821 43143315 6 179359225 612813673 23744855 0 84064108 9 18774933 5 896742149 62435897 6 102700644 Spektral dichte schatzung 4 351E 09 4 278E 09 2 526E 09 2 921E 09 1 210E 09 935924937 875492029 820375352 2 420E 09 2 429E 09 2 401E 09 2 263E 09 2 235E 09 99 Spektraldiagramme Die Tabelle f r univariate Statistiken enth lt die Datenpunkte die f r die grafische Darstellung des Periodogramms verwendet wurden Beachten Sie F r Frequenzen von weniger als 0 1 erscheint der gr te Wert in der Spalte Periodogramm bei einer Frequenz von 0 08333 das ist genau der Wert der zu erwarten ist wenn eine j hrliche periodische Komponente vorliegt Diese Daten best tigen die Identifikation der Spitze mit der niedrigsten Frequenz mit einer j hrlichen periodischen Komponente Doch was ist mit den anderen Spitzen bei h heren Frequenzen Abbildung 11 4 Spektraldichte 9 745E9 4 1 319E9 4 Dichte 4 852E8 4 1 785E8 6 566E7 fs lee sh 15 eo qi 00 0 1 0 2 0 3 0 4 0 5 H ufigkeit Die restlichen Spitzen werden am besten mit der Spektraldichtefunktion analysiert bei der es sich einfach um eine gegl ttete Version des Periodog
2. 107 bersicht ber ACF PACF Diagramme ARIMA 1 0 1 o lt 0 0 gt 0 PACF 1 0 1 ARIMA 2 0 0 6162 gt 0 PACF 1 0 1 ARIMA 0 1 0 integrierte Zeitreihe ACF 1 0 1 ACF 1 0 1 ACF 1 0 1 Anhang Beispieldateien Die zusammen mit dem Produkt installierten Beispieldateien finden Sie im Unterverzeichnis Samples des Installationsverzeichnisses Beschreibungen Im Folgenden finden Sie Kurzbeschreibungen der in den verschiedenen Beispielen in der Dokumentation verwendeten Beispieldateien accidents sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Versicherungsgesellschaft geht die alters und geschlechtsabh ngige Risikofaktoren f r Autounf lle in einer bestimmten Region untersucht Jeder Fall entspricht einer Kreuzklassifikation von Alterskategorie und Geschlecht adl sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Bem hungen geht die Vorteile einer vorgeschlagenen Therapieform f r Schlaganfallpatienten zu ermitteln rzte teilten weibliche Schlaganfallpatienten nach dem Zufallsprinzip jeweils einer von zwei Gruppen zu Die erste Gruppe erhielt die physische Standardtherapie die zweite erhielt eine zus tzliche Emotionaltherapie Drei Monate nach den Behandlungen wurden die F higkeiten der einzelnen Patienten bliche Alltagsaktivit ten auszuf hren als ordinale Variablen bewertet advert sav Hierbei handelt es sich um eine hypot
3. Klicken Sie auf die Registerkarte Speichern 54 Kapitel 6 Abbildung 6 6 Zeitreihenmodellierung Registerkarte Speichern EM Zeitreihenmodellierung u Variablen Statistik Diagramme Ausgabefilter Speichern Optionen Variablen speichern Variablen Beschreibung Speichern Pr fix f r Variablennamen Vorhergesagte Werte v _ Vorhersagewert Untere Konfidenzgrenzen Obere Konfidenzgrenzen Residuum Rauschen F r jedes ausgew hlte Element wird je abh ngiger Variablen eine Variable gespeichert Modelldatei exportieren Datei modes xn gt Aktivieren Sie in der Spalte Speichern den Eintrag Vorhergesagte Werte und behalten Sie den Standardwert Vorhersagewert als Pr fix f r Variablennamen bei Die Modellvorhersagen werden als neue Variablen in der Arbeitsdatei gespeichert wobei Vorhersagewert als Pr fix f r die Variablennamen verwendet wird Sie k nnen die Spezifikationen f r jedes Modell auch in einer externen XML Datei speichern Dies erm glicht Ihnen die Modelle erneut zu verwenden wenn Sie die Vorhersage bei der Verf gbarkeit neuer Daten ausweiten m chten Klicken Sie auf der Registerkarte Speichern auf die Schaltfl che Durchsuchen Dadurch wird ein Standarddialogfeld zum Speichern von Dateien ge ffnet gt Wechseln Sie in den Ordner in dem Sie die XML Modelldatei speichern m chten Geben Sie einen Dateinamen ein und klicken Sie auf Speichern Der Pfad f
4. Aktuelle Transformation abh ngiger Variablen Keine O Quadratwurzel O Nat rl Log Konstante in Modell einschlie en 13 Zeitreihenmodellierung Auf der Registerkarte Modelle k nnen Sie die Struktur eines benutzerdefinierten ARIMA Modells festlegen ARIMA Ordnungen Geben Sie Werte f r die verschiedenen ARIMA Komponenten des Modells in die entsprechenden Zellen des Strukturgitters ein Alle Werte m ssen nicht negative Ganzzahlen sein Bei autoregressiven Komponenten und Komponenten des gleitenden Durchschnitts stellt der Wert die h chste Ordnung dar Alle positiven niedrigeren Ordnungen werden in das Modell eingeschlossen Wenn Sie beispielsweise 2 angeben enth lt das Modell die Ordnungen 2 und 1 Die Zellen in der Spalte Saisonal sind nur verf gbar wenn f r die Arbeitsdatei eine Periodizit t definiert wurde siehe im Folgenden unter Aktuelle Periodizit t m Autoregressiv p Die Anzahl autoregressiver Ordnungen im Modell Autoregressive Ordnungen geben die zur ckliegenden Werte der Zeitreihe an die f r die Vorhersage der aktuellen Werte verwendet werden Eine autoregressive Ordnung von 2 gibt beispielsweise an dass die Werte der Zeitreihe die zwei Zeitperioden zur ckliegt f r die Vorhersage der aktuellen Werte verwendet wird m Differenz d Gibt die Ordnung der Differenzierung an die vor dem Sch tzen der Modelle auf die Zeitreihe angewendet wurde Differenzierung ist erforderlich
5. Transformieren erstellt neue Zeitreihenvariablen als Funktionen bestehender Zeitreihenvariablen Dazu geh ren Funktionen die benachbarte Beobachtungen zum Gl tten zur Durchschnittsberechnung und zur Differenzierung verwenden m Die Prozedur Fehlende Werte ersetzen im Men Transformieren ersetzt system und benutzerdefiniert fehlende Werte durch Sch tzwerte auf der Grundlage einer von mehreren m glichen Methoden Fehlende Daten am Anfang oder Ende einer Zeitreihe stellen kein gr eres Problem dar Sie verk rzen nur die brauchbare L nge der Zeitreihe L cken im Inneren einer Zeitreihe eingebettete fehlende Daten k nnen ein viel schwerwiegenderes Problem darstellen Genauere Informationen zu Datentransformationen f r Zeitreihen finden Sie im Benutzerhandbuch f r Base Sch tz und Validierungsperioden H ufig ist es sinnvoll die Zeitreihe in eine Sch tzperiode bzw historische Periode und eine Validierungsperiode aufzuteilen Sie entwickeln ein Modell auf der Grundlage der Beobachtungen in der Sch tzperiode historischen Periode und testen dann in der Validierungsperiode wie gut es funktioniert Wenn Sie das Modell zum Vorhersagen von bekannten Punkten die Punkte in der Validierungsperiode verwenden erhalten Sie einen Eindruck von der G te der Vorhersagen des Modells Die F lle in der Validierungsperiode werden als Pr ff lle bezeichnet da Sie aus dem Erstellungsprozess des Modell ausgeschlossen und
6. C Mittlerer absoluter Fehler C Part Residuen Autokorrelationsfunktion PACF Diagramme nach einzelnen Modellen Datenreihen C Residuen Autokorrelationsfunktion ACF Diagrammanzeige Beobachtete Werte Part Residuen Autokorrelationsfunktion PACF C orhersagen Konfidenzintervalle f r Vorhersagen Konfidenzinterv f r Anpassungswerte Deaktivieren Sie die Option Vorhersagen Das vorliegende Beispiel soll nur erl utern wie signifikante Einflussvariablen ermittelt und ein Modell erstellt wird Es werden keine Vorhersagen aufgestellt W hlen Sie Anpassungswerte aus Bei dieser Option werden die vorhergesagten Werte f r die Periode angezeigt in der das Modell gesch tzt wird Diese Periode wird als Sch tzperiode bezeichnet und enth lt alle F lle in der Arbeitsdatei f r dieses Beispiel Diese Werte bieten einen Hinweis darauf wie gut das Modell an die beobachteten Werte angepasst ist Daher werden sie als Anpassungswerte bezeichnet Das resultierende Diagramm enth lt die beobachteten Werte und die Anpassungswerte gt Klicken Sie im Dialogfeld Zeitreihenmodellierung auf OK 74 Kapitel 8 Zeitreihendiagramm Abbildung 8 8 Vorhergesagte und beobachtete Werte Beobachtet 40 000 Anpassung 20 000 men Modell_1 Die vorhergesagten Werte entsprechen den beobachteten Werten recht gut Dies deutet darauf hin dass das Modell eine zufrieden stellende Vorhersagekraf
7. C Nat rlicher Logarithmus Aktuelle Periodizit t 12 C Ein Diagramm je Variable Einf gen Zur cksetzen Abbrechen Hilfe Wahlen Sie die Variable Sales of Men s Clothing aus und verschieben Sie sie in die Liste Variablen W hlen Sie die Variable Date aus und verschieben Sie sie in das Feld Zeitachsenbeschriftung Klicken Sie auf OK 68 Kapitel 8 Abbildung 8 2 Absatz an Herrenbekleidung in US Dollar 40000 00 20000 00 Sales of Men s Clothing 0 00 c 400 5 5 BSI 8s 8s Die Datenreihe weist zahlreiche Spitzen auf die h ufig scheinbar in gleichen Abst nden zu finden sind und zeigt einen deutlichen Aufw rtstrend Diese Spitzen mit gleichen Abst nden deuten auf das Vorhandensein einer periodischen Komponente in der Zeitreihe hin In Anbetracht der saisonalen Natur der Verk ufe die normalerweise in der Weihnachtszeit Spitzenwerte aufweisen d rften Sie nicht verwundert sein eine j hrliche saisonale Komponente in den Daten zu finden Au erdem sind Spitzen vorhanden die nicht als Teil des Saisonmusters erscheinen und signifikante Abweichungen von den benachbarten Datenpunkten darstellen Bei diesen Punkten kann es sich um Ausrei er handeln die mit dem Expert Modeler bearbeitet werden k nnen und sollten Durchf hrung der Analyse So verwenden Sie den Expert Modeler W hlen Sie die folgenden Befehle aus den Men s aus Analys
8. Diagramme zum Vergleichen von Modellen EIR Quadrat C Mittlerer absoluter Fehler Diagramme nach einzelnen Modellen _ Datenreihen Diagrammanzeige C Wurzel der mittleren Fehler Quadratsumme C Mittlerer absoluter Fehler in Prozent C Maximaler absoluter Fehler in Prozent C Maximaler absoluter Fehler C Normalisiertes BIC C Residuen Autokorrelationsfunktion ACF _ Part Residuen Autokorrelationsfunktion PACF C Residuen Autokorrelationsfunktion ACF J Part Residuen Autokorrelationsfunktion PACF abbechen gt Deaktivieren Sie im Gruppenfeld Diagramme nach einzelnen Modellen die Option Datenreihen Hierbei werden die Zeitreihen Diagramme f r einzelne Modelle unterdr ckt Das vorliegende Beispiel soll in erster Linie erl utern wie die Vorhersagen in neuen Variablen gespeichert werden Das Erzeugen von Diagrammen der Vorhersagen ist nur von sekund rem Interesse gt Klicken Sie im Dialogfeld Zeitreihenmodell zuweisen auf OK Statistiken zur Anpassungsg te des Modells Abbildung 7 4 Anpassungsg te des Modells Tabelle Anpassungsstatistik Mittelwert R Quadrat f r station ren Teil R Quadrat RMSE MAPE MaxAPE MAE MaxAE Normalisiertes BIC 313 999 186 630 858 2 416 143 024 497 210 10 116 Standardf ehler 178 000 150 840 081 500 112 632 424 651 1 352 Minimum Perzentil Maximum 50 610 j N 266
9. Kapitel 3 Maximaler absoluter Fehler in Prozent Maximaler absoluter Fehler Normalisiertes BIC Residuen Autokorrelationsfunktion ACF Part Residuen Autokorrelationsfunktion PACF F r weitere Informationen siehe Ma e f r die Anpassungsg te in Anhang A auf S 101 Diagramme nach einzelnen Modellen Datenreihen Aktivieren Sie diese Option um f r die einzelnen Modelle Diagramme der vorhergesagten Werte zu erhalten Beobachtete Werte Anpassungswerte Konfidenzintervalle f r Anpassungswerte und Autokorrelationen sind nur verf gbar wenn die Modellparameter erneut gesch tzt werden Erneut aus den Daten sch tzen auf der Registerkarte Modelle Sie k nnen eine oder mehrere der folgenden Optionen f r die Aufnahme in das Diagramm ausw hlen Beobachtete Werte Die beobachteten Werte der abh ngigen Zeitreihe Vorhersagen Die vom Modell vorhergesagten Werte f r die Vorhersageperiode Anpassungswerte Die vom Modell vorhergesagten Werte f r die Sch tzperiode Konfidenzintervalle f r Vorhersagen Die Konfidenzintervalle f r die Vorhersageperiode Konfidenzintervalle f r Anpassungswerte Die Konfidenzintervalle f r die Sch tzperiode Residuen Autokorrelationsfunktion ACF Zeigt f r jedes gesch tzte Modell ein Diagramm der Residuen Autokorrelationen an Part Residuen Autokorrelationsfunktion PACF Zeigt f r jedes gesch tzte Modell ein Diagramm der partiellen Residuen Autokorrelationen an 35 Zeitreihe
10. Maximaler absoluter Fehler Normalisiertes BIC F r weitere Informationen siehe Ma e f r die Anpassungsg te in Anhang A auf S 101 Statistik f r Modellvergleich Mit dieser Gruppe von Optionen wird die Anzeige der Tabellen gesteuert die die f r alle Modelle berechneten Statistiken enthalten F r jede Option wird eine eigene Tabelle erstellt Sie k nnen eine oder mehrere der folgenden Optionen ausw hlen m G te der Anpassung Tabelle der Auswertungsstatistiken und Perzentile f r R Quadrat f r station ren Teil R Quadrat Wurzel der mittleren Fehler Quadratsumme mittlerer absoluter Fehler in Prozent mittlerer absoluter Fehler maximaler absoluter Fehler in Prozent maximaler absoluter Fehler und normalisiertes Bayes Informationskriterium m Residuen Autokorrelationsfunktion ACF Tabelle der Auswertungsstatistiken und Perzentile f r Autokorrelationen der Residuen f r alle gesch tzten Modelle m Part Residuen Autokorrelationsfunktion PACF Tabelle der Auswertungsstatistiken und Perzentile f r partielle Autokorrelationen der Residuen f r alle gesch tzten Modelle Statistik nach einzelnen Modellen Mit dieser Gruppe von Optionen wird die Anzeige der Tabellen gesteuert die detaillierte Informationen zu den einzelnen gesch tzten Modellen enthalten F r jede Option wird eine eigene Tabelle erstellt Sie k nnen eine oder mehrere der folgenden Optionen ausw hlen m Parametersch tzer Zeigt f r jedes gesch tzte Modell
11. Fehler in Prozent MaxAPE normalisiertes Bayes sches Informationskriterium BIC Residuen Autokorrelationsfunktion partielle Autokorrelationsfunktion Ljung Box O Diagramme Diagramme f r alle Modelle Histogramm von R Quadrat f r station ren Teil R Quadrat R2 Wurzel der mittleren Fehler Quadratsumme RMSE mittlerer absoluter Fehler MAE mittlerer absoluter Fehler in Prozent MAPE maximaler absoluter Fehler MaxAE maximaler absoluter Fehler in Prozent MaxAPE normalisiertes Bayes sches Informationskriterium BIC Boxplots der Residuen Autokorrelationen und partiellen Autokorrelationen Ergebnisse f r einzelne Modelle Vorhersagewerte Anpassungswerte beobachtete Werte untere und obere Konfidenzgrenzen Residuen Autokorrelationen und partielle Autokorrelationen Erl uterungen der Daten f r die Prozedur Zeitreihenmodell zuweisen Daten Die Variablen abh ngige und unabh ngige denen Modelle zugewiesen werden m ssen numerisch sein Annahmen Modelle werden Variablen in der Arbeitsdatei zugewiesen die die gleichen Namen wie die im Modell angegebenen Variablen tragen Alle diese Variablen werden als Zeitreihen behandelt d h jeder Fall repr sentiert einen Zeitpunkt und die nachfolgenden F lle liegen jeweils ein konstantes Zeitintervall auseinander m Vorhersagen Wenn Vorhersagen anhand von Modellen mit unabh ngigen Variablen Einflussvariablen Pr diktoren erstellt werden sollen muss die Arbeitsd
12. Kapitel 2 m Keine Es wird keine Transformation durchgef hrt Quadratwurzel Quadratwurzeltransformation m Nat rlicher Logarithmus Transformation mit nat rlichem Logarithmus Benutzerdefinierte ARIMA Modelle Mit der Zeitreihenmodellierung k nnen benutzerdefinierte nichtsaisonale oder saisonale univariate ARIMA Modelle auch als Box Jenkins Modelle Box Jenkins als auch Reinsel 1994 bekannt mit oder ohne feste Gruppe von Einflussvariablen Pr diktoren erstellt werden ARIMA steht f r Autoregressive Integrated Moving Average engl f r autoregressiver integrierter gleitender Durchschnitt Sie k nnen f r einige oder alle Pr diktoren bertragungsfunktionen definieren die automatische Erkennung von Ausrei ern festlegen oder eine bestimmte Gruppe von Ausrei ern angeben m Alle auf der Registerkarte Variablen angegebenen unabh ngigen Variablen Pr diktoren werden explizit in das Modell eingeschlossen Im Gegensatz dazu werden im Expert Modeler unabh ngige Variablen nur eingeschlossen wenn sie eine statistisch signifikante Beziehung mit der abh ngigen Variablen aufweisen Modellspezifikation f r benutzerdefinierte ARIMA Modelle Abbildung 2 5 Dialogfeld ARIMA Kriterien Registerkarte Modell Zeitreihenmodellierung ARIMA Kriterien Modell bertragungsfunktion Ausrei er ARIMA Ordnungen Struktur Nichtsaisonal Saisonal Autoregressiv p 0 0 Differenz d 0 0 Gleitender Durchschnitt 0 0
13. W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Modelle erstellen Abbildung 6 3 Dialogfeld Zeitreihenmodellierung E Zeitreihenmodellierung u Variablen Statistik Diagramme Ausgabefilter Speichern Optionen variablen Abh ngige Variablen E Subscribers for Market 1 Market_1 E YEAR not periodic YEAR _ 8E Subscribers for Market 2 Market _2 amp MONTH period 12 MONTH_ E Subscribers for Market 3 Market _3 E Subscribers for Market 4 Market _4 8 Subscribers for Market 5 Market_5 lt gt Unabh ngige Variablen Methode Expert Modeler v Modelltyp Alle Modelle Sch tzperiode Vorhersageperiode Start Erster Fall Start Erster Fall nach der Sch tzperiode Ende Letzter Fall Ende Letzter Fall in der Arbeitsdatei W hlen Sie die Variablen Subscribers for Market I bis Subscribers for Market 85 als abh ngige Variablen aus gt Stellen Sie sicher dass in der Dropdown Liste Methode die Option Expert Modeler ausgew hlt ist Der Expert Modeler ermittelt automatisch das jeweils am besten angepasste Modell f r jede der abh ngigen Zeitreihen 52 Kapitel 6 Die Gruppe der F lle die f r die Sch tzung des Modells verwendet wird wird als Sch tzperiode bezeichnet In der Standardeinstellung umfasst sie s mtliche F lle in der Arbeitsdatei Sie k nnen die Sch tzperiode festlegen indem Sie im Dialogfeld F lle au
14. _ Aktuelle Periodizit t 12 Einf gen Zur cksetzen Abbrechen Hilfe So stellen Sie die saisonbereinigte Zeitreihe grafisch dar ffnen Sie das Dialogfeld Sequenzdiagramme gt Klicken Sie auf Zur cksetzen um fr here Einstellungen zu l schen gt Klicken Sie mit der rechten Maustaste auf eine beliebige Stelle in der Quellvariablenliste und w hlen Sie im Kontextmen die Option Variablennamen anzeigen aus gt W hlen Sie die Variable SAS _ aus und verschieben Sie sie in die Liste Variablen Klicken Sie auf OK 95 Saisonale Zerlegung Abbildung 10 9 Saisonbereinigte Zeitreihe 30000 00000 20000 00000 10000 00000 Absatz f r Herrenbekleidung 0 00000 yy ye Sin ye U Hu Sy u u 4G 79 790 79 Oa 79 79 79 79 79 7 79 79 7979 w y YY EA A V Vy A 5 590 D D Gy D PD Die saisonbereinigte Zeitreihe zeigt einen klaren Aufw rtstrend Es ist eine Reihe von Spitzen vorhanden sie erscheinen jedoch in zuf lligen Abst nden ohne Anzeichen f r ein j hrliches Muster Zusammenfassung Mit der Prozedur Saisonale Zerlegung wurde die saisonale Komponente einer periodischen Zeitreihe entfernt um eine Zeitreihe zu erstellen die sich besser f r die Trendanalyse eignet Die Untersuchung der Autokorrelationen und partiellen Autokorrelationen war hilfreich f r die Ermittlung der zugrunde liegenden Periodizit t in diesem Fall j hrlich Verwandte Proz
15. hlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Saisonale Zerlegung 40 41 Abbildung 4 1 Dialogfeld Saisonale Zerlegung E Saisonale Zerlegung L women L men gs jewel L mail p page Modelltyp phone war J E print a L service O Additiv YEAR E 3 A EAR_ Gewichtung f r gleitenden Durchschnit fll mon 2 Alle Punkte gleich Endpunkte gewichtet mit 0 5 Aktuelle Periodizit t 12 Fallweise Auflistung Zur cksetzen Abbrechen Saisonale Zerlegung W hlen Sie eine oder mehrere Variablen aus der Liste der verf gbaren Variablen und verschieben Sie sie in die Liste Variable n Achten Sie darauf dass die Liste nur numerische Variablen enth lt Modelltyp Die Prozedur Saisonale Zerlegung bietet zwei verschiedene Ans tze f r die Modellierung der saisonalen Faktoren multiplikativ und additiv Multiplikativ Die saisonale Komponente ist ein Faktor mit dem die saisonal bereinigte Zeitreihe multipliziert wird um die urspr ngliche Zeitreihe zu erhalten Tats chlich werden mit dem Modul Trends saisonale Komponenten gesch tzt die proportional zum Gesamtniveau der Zeitreihe sind Beobachtungen ohne saisonale Variation haben eine saisonale Komponente von 1 m Additiv Die saisonalen Anpassungen werden zu der saisonbereinigten Zeitreihe addiert um die beobachteten Werte zu erhalten
16. proportional zum Niveau der Zeitreihe sein k nnten Dies wiederum legt nahe dass es sich um ein multiplikatives und nicht um ein additives Modell handelt Die Untersuchung der Autokorrelationen und partiellen Autokorrelationen einer Zeitreihe erlaubt eine quantitativere Schlussfolgerung ber die zugrunde liegende Periodizit t W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Autokorrelationen Abbildung 10 3 Dialogfeld Autokorrelationen Autokorrelationen Optionen 2 Date date L Sales of Women s Clothing 8 Sales of Jewelry jewel E Number of Catalogs Mailed E Number of Pages in Catalo L Number of Phone Lines Op 9 Amount Spent on Print Adv Transformieren E Number of Customer Servi Nat rlicher Logarithmus z Differenz Anzeige v Autokorrelationen V Partielle Autokorrelationen Aktuelle Periodizit t Keine a Einf gen Zur cksetzen J Abbrechen Wahlen Sie die Variable Sales of Men s Clothing aus und verschieben Sie sie in die Liste Variablen Klicken Sie auf OK 91 Saisonale Zerlegung Abbildung 10 4 Autokorrelationsdiagramm f r Herrenbekleidung 10 O Koeffizient obere Vertrauensgrenze Untere Vertrauensgrenze 0 5 oo UU eee ACF F7PP TS OPP I DWYALD 74 75 Lag Number Die Autokorrelationsfunktion zeigt eine signifikante Spi
17. r den station ren Teil bis zu einem Maximalwert von 1 weisen auf eine bessere Anpassung hin Ein Wert von 0 948 bedeutet dass das Modell f r die Erkl rung der beobachteten Variation in der Datenreihe bestens geeignet ist Die Box Ljung Statistik auch modifizierte Box Pierce Statistik genannt bietet einen Hinweis darauf ob das Modell ordnungsgem spezifiziert wurde Ein Signifikanzwert unter 0 05 weist darauf hin dass in der beobachteten Datenreihe Strukturen vorhanden sind die im Modell nicht ber cksichtigt werden Der hier gezeigte Wert 0 984 ist nicht signifikant Daher kann davon ausgegangen werden dass das Modell richtig spezifiziert wurde Der Expert Modeler hat neun Punkte als Ausrei er erkannt Jeder dieser Punkte wurde ordnungsgem modelliert daher m ssen sie nicht aus der Datenreihe entfernt werden 76 Kapitel 8 Tabelle der ARIMA Modellparameter Abbildung 8 11 Tabelle der ARIMA Modellparameter Ben no ee Sales of Men s Sales of Men s Clothing Keine Transformation Saisonale Differenz Clothing Modell_1 Number of Catalogs Keine Transformation Z hler Lag 0 ori 21 943 000 Mailed Saisonale Differenz Number of Phone Lines Keine Transformation Z hler Lag 0 315 262 15 298 20 607 000 Open for Ordering Saisonale Differenz 1 In der Tabelle der ARIMA Modellparameter werden Werte ftir alle Parameter im Modell aufgef hrt wobei f r jedes gesch tzte Modell ein mit dem Modellbezeichner beschrifteter Ein
18. r die XML Modelldatei wird daraufhin auf der Registerkarte Speichern angezeigt gt Klicken Sie auf die Registerkarte Statistik 55 Prognosen f r gro e Datenmengen mit dem Expert Modeler Abbildung 6 7 Zeitreihenmodellierung Registerkarte Statistik EM Zeitreihenmodellierung Variablen Statistik Diagramme Ausgabefilter Speichern Optionen M Anpassungsmafie Ljung Box Statistik und Anzahl von Ausrei ern nach Modell anzeigen Anpassungsma e R Quadrat f r station ren Teil C Mittlerer absoluter Fehler JR Quadrat Maximaler absoluter Fehler in Prozent C wurzel der mittleren Fehler Quadratsumme C Maximaler absoluter Fehler Mittlerer absoluter Fehler in Prozent _ Normalisiertes BIC Statistik Fir Modellvergleich Statistik nach einzelnen Modellen G te der Anpassung Parametersch tzer Residuen Autokorrelationsfunktion ACF Residuen Autokorrelationsfunktion ACF C Part Residuen Autokorrelationsfunktion PACF C Part Residuen Autokorrelationsfunktion PACF Abbrechen W hlen Sie Vorhersagen anzeigen aus Mithilfe dieser Option wird f r jede abh ngige Variablenreihe eine Tabelle der vorhergesagten Werte erstellt Dies ist neben der M glichkeit die Vorhersagen als neue Variablen zu speichern eine weitere Option mit der diese Werte berechnet werden k nnen Bei der Standardauswahl G te der Anpassung im Gruppenfeld Statistik f r Modellvergleich wir
19. wenn Trends vorhanden sind Zeitreihen mit Trends sind normalerweise nichtstation r und bei der ARIMA Modellierung wird Stationarit t angenommen Mithilfe der Differenzierung werden die Effekte der Trends entfernt Die Ordnung der Differenzierung entspricht dem Grad des Trends der Zeitreihe Differenzierung erster Ordnung erkl rt lineare Trends Differenzierung zweiter Ordnung erkl rt quadratische Trends usw m Gleitender Durchschnitt q Die Anzahl von Ordnungen des gleitenden Durchschnitts im Modell Ordnungen des gleitenden Durchschnitts geben an wie Abweichungen vom Mittelwert der Zeitreihe f r zur ckliegende Werte zum Vorhersagen der aktuellen Werte verwendet werden Ordnungen des gleitenden Durchschnitts von und 2 geben beispielsweise an dass beim Vorhersagen der aktuellen Werte der Zeitreihe Abweichungen vom Mittelwert der Zeitreihe von den beiden letzten Zeitperioden ber cksichtigt werden sollen Saisonale Ordnungen Saisonale autoregressive Komponenten Komponenten des gleitenden Durchschnitts und Differenzierungskomponenten entsprechen im Prinzip ihren nichtsaisonalen Gegenst cken Bei saisonalen Ordnungen werden die Werte der aktuellen Zeitreihe jedoch von Werten zur ckliegender Zeitreihen beeinflusst die um eine oder mehrere saisonalen Perioden getrennt sind Bei monatlichen Daten saisonale Periode von 12 beispielsweise bedeutet eine saisonale Ordnung von 1 dass der Wert der aktuellen Zeitreihe durch den Zeitreihenwert
20. 0 cc ccc cee eee eens Zusammenfassung n anaana ee een ee een eee e eens 9 Untersuchen von Einflussvariablen durch das Zuweisen gespeicherter Modelle Erweitern der Pr diktorzeitreihe 2 222 ccc ct eee ndern der Werte von Einflussvariablen in der Vorhersageperiode 0 Durchf hrung der Analyse 0 0 0 0 ccc cece eee eee tee e nee e eens 10 Saisonale Zerlegung Entfernen der Saisonalit t aus Verkaufsdaten 0 0c e cece eee eee eee Bestimmen und Festlegen der Periodizitat 0 0 0 0c ccc cee eee Durchf hrung der Analyse 1 0 0 ccc cence nent n ee nees Interpretation der Ausgabe 0 0 ccc eee nent tenes Zusammenfassung 1 ee eee nent eee ees Verwandte Prozeduren 0 000 cece eee tenet eee 11 Spektraldiagramme Verwendung von Spektraldiagrammen zur Uberpriifung der Erwartungen hinsichtlich der Periodizitat s se na aan na lente asad ns lan tie Seas ita A caste Be Spheres apa adn sanded aged Durchf hrung der Analyse 1 0 ccc cee ene n teen ee nes Zum Verst ndnis des Periodogramms und der Spektraldichte Zusammenfassung 1 ee ee eee tne eens Verwandte Prozeduren 2 0 0c cece eee ttt tenes vii 66 Anh nge A Ma e f r die Anpassungsg te B Ausrei ertypen C bersicht ber ACF PACF Diagramme D Beispieldateien Bibliografie Index viii 101 103 104 108 120 122 Teil I Ben
21. 2 12 Zeitreihenmodellierung Registerkarte Optionen E Zeitreihenmodellierung Variablen Statistik Diagramme Ausgabefilter Speichern Optionen Vorhersageperiode O Erster Fall nach der Sch tzperiode bis letzter Fall in der Arbeitsdatei Erster Fall nach der Schatzperiode bis zum angegebenen Datum Datum Jahr Monat 2004 3 Benutzerdefinierte fehlende Werte Konfidenzintervallbreite 95 Als ung ltig behandeln Pr fix f r Modellbezeichner in Modell ls g ltig behandeln A In ACF und PACF Ausgabe angezeigte maximale Anzahl von Intervallen 24 Auf der Registerkarte Optionen k nnen Sie die Vorhersageperiode die Behandlung fehlender Werte und die Breite des Konfidenzintervalls festlegen ein benutzerdefiniertes Pr fix f r Modellbezeichner angeben und die f r die Autokorrelationen angezeigte Anzahl von Intervallen festlegen Vorhersageperiode Die Vorhersageperiode beginnt immer mit dem ersten Fall nach dem Ende der Sch tzperiode d h der Gruppe von F llen die das Modell bestimmt und endet entweder mit dem letzten Fall in der Arbeitsdatei oder an einem vom Benutzer festgelegten Datum In der Standardeinstellung endet die Sch tzperiode mit dem letzten Fall in der Arbeitsdatei Das Ende kann jedoch im Dialogfeld F lle ausw hlen durch Auswahl der Option Nach Zeit oder Fallbereich ge ndert werden m Erster Fall nach der Sch tzperiode bis letzter Fall in der Arbeitsdatei
22. 31 33 in Zeitreihenmodellierung 17 19 R f r station ren Teil 101 in Zeitreihenmodell zuweisen 31 33 Index in Zeitreihenmodellierung 17 19 75 Residuen in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 RMSE 101 in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 Saisonal additiver Ausrei er 103 in Zeitreihenmodellierung 9 16 Saisonale Differenztransformation ARIMA Modelle 13 saisonale Ordnungen ARIMA Modelle 13 Saisonale Zerlegung 40 42 43 Annahmen 40 Berechnen der gleitenden Durchschnitte 40 Erstellen von Variablen 42 Modelle 40 neue Variablen 93 periodische Datumskomponente 88 Speichern von neuen Variablen 42 verwandte Prozeduren 95 Sch tzperiode 2 in Zeitreihenmodell zuweisen 29 in Zeitreihenmodellierung 7 52 speichern erneut gesch tzte Modelle als XML 37 Modellspezifikationen als XML 22 Modellvorhersagen 22 37 neue Variablennamen 22 37 Spektraldiagramme 44 47 Annahmen 44 bivariate Spektralanalyse 46 Periodogramm 98 Spektraldichte 98 Spektralfenster 44 verwandte Prozeduren 100 Zentriertransformation 46 Transformation mit nat rlichem Logarithmus in Zeitreihenmodellierung 10 12 14 Transienter Ausrei er 103 in Zeitreihenmodellierung 9 16 bertragungsfunktionen 14 Nenner Terme 14 Ordnung der Differenzen 14 saisonale Ordnungen 14 Verz gerung 14 Z hler Terme 14 Validierungsperiode 2 Variablennamen in Ze
23. 494 1 000 999 999 812 212 138 619 197 176 1 136 854 916 4 164 2 309 2 593 632 596 107 809 154 517 2269 688 368 380 567 763 13 531 9 995 10 732 577 999 426 084 964 2 952 321 606 1182 352 12 240 590 1 000 482 442 977 3 718 365 637 1358 681 12 489 64 Kapitel 7 Die Tabelle Anpassungsg te des Modells enth lt modell bergreifend berechnete Statistiken zur Anpassungsg te Diese Tabelle ist eine pr zise Auswertung wie gut das Modell mit den neu gesch tzten Parametern an die Daten angepasst ist F r jede Statistik enth lt die Tabelle modell bergreifend den Mittelwert den Standardfehler den Minimal und den Maximalwert Dar ber hinaus enth lt sie Perzentilwerte f r die Verteilung der Statistik ber die Modelle Das jeweilige Perzentil gibt den Prozentsatz der Modelle an die einen Wert der Anpassungsstatistik aufweisen der unter dem angegebenen Wert liegt Beispielsweise weisen 95 der Modelle einen maximalen absoluten Fehler in Prozent MaxAPE unter 3 676 auf Es werden mehrere Statistiken ausgegeben hier sind jedoch zwei von besonderer Bedeutung MAPE mittlerer absoluter Fehler in Prozent und MaxAPE maximaler absoluter Fehler in Prozent Der absolute Fehler in Prozent ist ein Ma daf r wie sehr eine abh ngige Zeitreihe vom Niveau abweicht das vom Modell vorhergesagt wurde und bietet einen Hinweis auf die Unsicherheit der Vorhersage Der mittlere
24. Ausgabefilter Speichern Optionen Vorhersageperiode Ob Erster Fall nach der Schatzperiode bis letzter Fall in der Arbeitsdatei Erster Fall nach der Sch tzperiode bis zum angegebenen Datum Datum Jahr Monat 1999 3 Benutzerdefinierte fehlende Werte S 3 es Konfidenzintervallbreite Als ung ltig behandeln Bn Pr fix f r Modellbezeichner in Modell Als g ltig behandeln ei In ACF und PACF Ausgabe P 2 24 angezeigte maximale Anzahl von Intervallen gt Wahlen Sie im Gruppenfeld Vorhersageperiode die Option Erster Fall nach der Schatzperiode bis zum angegebenen Datum aus gt Geben Sie im Datumsgitter f r das Jahr 1999 und f r den Monat 3 ein Das Daten Set enth lt Daten von Januar 1989 bis Dezember 1998 sodass mit den aktuellen Einstellungen die Vorhersageperiode Januar 1999 bis M rz 1999 umfasst gt Klicken Sie auf OK Abbildung 9 4 Neue Variablen mit Vorhersagen f r Pr diktorzeitreihen Vorhersagewert_mail_ Vorhersagewert_phone_ Modell_1 Modell_2 Variablenansicht Im Daten Editor werden die neuen Variablen Vorhersagewert_mail_Modell_1 und Vorhersagewert_phone_Modell_2 angezeigt die die durch das Modell vorhergesagten Werte fiir die Anzahl der per Post versendeten Kataloge und die Anzahl der Telefonleitungen enthalten 81 Untersuchen von Einflussvariablen durch das Zuweisen gespeicherter Modelle Zum Erweitern der Pr diktorzei
25. Datendatei bei der es um die Bem hungen eines Unternehmens geht das die Informationen in seinem Data Warehouse nutzen m chte um spezielle Angebote f r Kunden zu erstellen die mit der gr ten Wahrscheinlichkeit darauf ansprechen Nach dem Zufallsprinzip wurde eine Untergruppe des Kundenstamms ausgew hlt Diese Gruppe erhielt die speziellen Angebote und die Reaktionen wurden aufgezeichnet customers_model sav Diese Datei enth lt hypothetische Daten zu Einzelpersonen auf die sich eine Marketingkampagne richtete Zu diesen Daten geh ren demografische Informationen eine bersicht ber die bisherigen Eink ufe und die Angabe ob die einzelnen Personen auf die Kampagne ansprachen oder nicht Jeder Fall entspricht einer Einzelperson customers_new sav Diese Datei enth lt hypothetische Daten zu Einzelpersonen die potenzielle Kandidaten f r Marketingkampagnen sind Zu diesen Daten geh ren demografische Informationen und eine bersicht ber die bisherigen Eink ufe f r jede Person Jeder Fall entspricht einer Einzelperson debate sav Hierbei handelt es sich um eine hypothetische Datendatei die gepaarte Antworten auf eine Umfrage unter den Zuh rern einer politischen Debatte enth lt Antworten vor und nach der Debatte Jeder Fall entspricht einem Befragten debate_aggregate sav Hierbei handelt es sich um eine hypothetische Datendatei in der die Antworten aus debate sav aggregiert wurden Jeder Fall entspricht einer Kreuzklassifika
26. Durch die Saisonbereinigung soll der saisonale Effekt aus einer Zeitreihe entfernt werden sodass m glicherweise durch die saisonale Komponente verdeckte interessante Eigenschaften der Zeitreihe betrachtet werden k nnen Tats chlich werden im Modul Trends saisonale Komponenten gesch tzt die nicht vom Niveau der Zeitreihe abh ngen Beobachtungen ohne saisonale Variation haben eine saisonale Komponente von 0 Gewichtung f r gleitenden Durchschnitt Mit den Optionen im Gruppenfeld Gewichtung f r gleitenden Durchschnitt k nnen Sie festlegen wie die Zeitreihen beim Berechnen der gleitenden Durchschnitte behandelt werden sollen Diese Optionen sind nur verf gbar wenn die Periodizit t der Zeitreihen regelm ig ist Falls die Periodizit t unregelm ig ist werden alle Punkte gleich gewichtet 42 Kapitel 4 Alle Punkte gleich Gleitende Durchschnitte werden mit einer Spanne berechnet die gleich der Periodizit t ist und so dass alle Punkte das gleiche Gewicht erhalten Diese Methode wird immer dann verwendet wenn die Periodizit t ungerade ist m Endpunkte gewichtet mit 0 5 Gleitende Durchschnitte f r Datenreihen mit gerader Periodizitat werden mit einer Spanne berechnet die gleich der Periodizit t plus 1 ist dabei werden die Endpunkte der Spanne mit 0 5 gewichtet Die folgenden Optionen sind verf gbar m Klicken Sie auf Speichern um anzugeben wie neue Variablen gespeichert werden sollen Saisonale Zerle
27. Es stellt ein gutes Beispiel f r intervallzensierte Daten dar und wurde an anderer Stelle Collett 2003 vorgestellt und analysiert 119 Beispieldateien ulcer_recurrence_recoded sav In dieser Datei sind die Daten aus ulcer_recurrence sav so umstrukturiert dass das Modell der Ereigniswahrscheinlichkeit f r jedes Intervall der Studie berechnet werden kann und nicht nur die Ereigniswahrscheinlichkeit am Ende der Studie Sie wurde an anderer Stelle Collett et al 2003 vorgestellt und analysiert verd1985 sav Diese Datendatei enth lt eine Umfrage Verdegaal 1985 Die Antworten von 15 Subjekten auf 8 Variablen wurden aufgezeichnet Die relevanten Variablen sind in drei Sets unterteilt Set 1 umfasst alter und heirat Set 2 besteht aus pet und news und in Set 3 finden sich music und live Die Variable pet wird mehrfach nominal skaliert und die Variable Alter ordinal Alle anderen Variablen werden einzeln nominal skaliert virus sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Internet Dienstanbieters geht der die Auswirkungen eines Virus auf seine Netzwerke ermitteln m chte Dabei wurde vom Moment der Virusentdeckung bis zu dem Zeitpunkt zu dem die Virusinfektion unter Kontrolle war der ungef hre prozentuale Anteil infizierter E Mail in den Netzwerken erfasst waittimes sav Hierbei handelt es sich um eine hypothetische Datendatei zu den Wartezeiten f r Kunden bei drei verschiede
28. F r weitere Informationen siehe Ausrei ertypen in Anhang B auf S 103 17 Zeitreihenmodellierung Bestimmte Zeitpunkte als Ausrei er modellieren Aktivieren Sie diese Option um bestimmte Zeitpunkte als Ausrei er zu modellieren Verwenden Sie f r jeden Ausrei er eine eigene Zeile im Ausrei erdefinitionsgitter Geben Sie in alle Zellen einer bestimmten Zeile Werte ein m Typ Der Ausrei ertyp Folgende Typen werden unterst tzt additiv Standardeinstellung Verschiebung im Niveau innovativ transient saisonal additiv und lokaler Trend Anmerkung 1 Wenn f r die Arbeitsdatei kein Datum angegeben wurde wird im Ausrei erdefinitionsgitter nur die Spalte Beobachtung angezeigt Um eine Ausrei er festzulegen geben Sie die Zeilennummer des entsprechenden Falles ein wie im Daten Editor angezeigt Anmerkung 2 Die Spalte Zyklus im Ausrei erdefinitionsgitter sofern vorhanden bezieht sich auf die Werte der Variablen CYCLE_ in der Arbeitsdatei Ausgabe Als Ausgabe stehen sowohl Ergebnisse f r einzelne Modelle als auch f r alle Modelle errechnete Ergebnisse zur Verf gung Die Ergebnisse f r einzelne Modelle k nnen ber vom Benutzer angegebene Kriterien auf eine Gruppe von am besten schlechtesten angepassten Modellen eingeschr nkt werden Statistiken und Vorhersagetabellen Abbildung 2 8 Zeitreihenmodellierung Registerkarte Statistik E Zeitreihenmodellierung Yariablen Statistik Diagramme Ausgabefilter S
29. H ufigkeit n gt MaxAPE Dieses Histogramm zeigt den modelliibergreifenden maximalen absoluten Fehler in Prozent MaxAPE an Es eignet sich dazu den schlechtesten Fall fiir Ihre Vorhersage zu skizzieren Es zeigt dass f r jedes Modell die gr te Fehlerprozentzahl im Bereich von 1 bis 5 liegt Stellen diese Werte eine akzeptable Unsicherheit dar Dies ist eine Situation in der Ihr Gesch ftssinn ins Spiel kommt da ein akzeptables Risiko von Fall zu Fall variiert Modellvorhersagen Abbildung 6 11 Neue Variablen mit Modellvorhersagen Vorhersagewert_Market_ j Vorhersagewert_Market_2_ 1_Modell_1 Modell_2 2003 10 OCT 2003 11820 51084 2003 11 NOY 2003 11857 51273 2003 12 DEC 2003 11687 53082 2004 1 JAN 2004 11503 54893 2004 2 FEB 2004 11447 55856 2004 3 MAR 2004 11390 56704 Der Daten Editor zeigt die neuen Variablen an die die Modellvorhersagen enthalten Auch wenn hier nur zwei gezeigt werden sind 85 neue Variablen vorhanden eine f r jede der 85 abh ngigen Zeitreihen Die Variablennamen bestehen aus dem Standardpr fix Vorhersagewert gefolgt vom Namen der verkn pften abh ngigen Variable zum Beispiel Market_I und einem Modellbezeichner zum Beispiel Modell _1 59 Prognosen f r gro e Datenmengen mit dem Expert Modeler Dem Daten Set wurden drei neue F lle mit den Vorhersagen von Januar 2004 bis M rz 2005 und automatisch erzeugten Datenlabels hinzugef gt Jede der neue Variablen enth lt Modellvorher
30. Prozedur Zeitreihenmodellierung erstellte Modelldatei verwenden Dieses Beispiel ist eine Erweiterung des vorhergehenden Beispiels Ermitteln von signifikanten Einflussvariablen mit dem Expert Modeler in Kapitel 8 auf S 66 kann jedoch auch unabh ngig verwendet werden Das Szenario betrifft ein Katalogunternehmen das Daten ber den monatlichen Umsatz von Herrenbekleidung von Januar 1989 bis Dezember 1998 sowie weitere Datenreihen erfasst hat die als potenziell n tzliche Einflussvariablen f r den zuk nftigen Umsatz angesehen werden Mit dem Expert Modeler wurde ermittelt dass nur zwei der f nf potenziellen Einflussvariablen signifikant sind die Anzahl der per Post versendeten Kataloge und die Anzahl der f r Bestellungen verf gbaren Telefonleitungen F r die Vertriebsstrategie im n chsten Jahr verf gen Sie ber begrenzte Ressourcen zum Drucken von Katalogen und zum Bereitstellen verf gbarer Telefonleitungen f r die Bestellungsannahme Ihr Budget f r die ersten drei Monate 1999 erm glicht ber die urspr nglichen Prognosen hinaus entweder 2000 zus tzliche Kataloge oder 5 zus tzliche Telefonleitungen Welche der beiden M glichkeiten f hrt in diesem Zeitraum von drei Monaten zu mehr Umsatzerl sen Die Daten f r das Modell befinden sich in catalog_seasfac sav catalog_model xml enth lt das mit dem Expert Modeler erstellte Modell des monatlichen Umsatzes F r weitere Informationen siehe Beispieldateien in Anhang D auf S 108
31. W hlen Sie diese Option aus wenn das Ende der Sch tzperiode vor dem letzten Fall in der Arbeitsdatei liegt und die Vorhersage auch den letzten Fall erfassen soll ber diese Option werden blicherweise 25 Zeitreihenmodellierung Vorhersagen f r eine Pr fperiode erstellt sodass die Modellvorhersagen mit einer Teilmenge der tats chlichen Werte verglichen werden k nnen m Erster Fall nach der Sch tzperiode bis zum angegebenen Datum W hlen Sie diese Option aus um das Ende der Vorhersageperiode explizit festzulegen ber diese Option werden blicherweise Vorhersagen erstellt die ber das Ende der tats chlichen Zeitreihe hinausreichen Geben Sie in alle Zellen des Datengitters Werte ein Wenn f r die Arbeitsdatei kein Datum angegeben wurde wird im Datengitter nur die Spalte Beobachtung angezeigt Um das Ende der Vorhersageperiode festzulegen geben Sie die Zeilennummer des entsprechenden Falles ein wie im Daten Editor angezeigt Die Spalte Zyklus im Datumsgitter sofern vorhanden bezieht sich auf die Werte der Variablen CYCLE _ in der Arbeitsdatei Benutzerdefinierte fehlende Werte Mit diesen Optionen wird die Behandlung benutzerdefinierter fehlender Werte gesteuert Als ung ltig behandeln Benutzerdefiniert fehlende Werte werden wie systemdefiniert fehlende Werte behandelt Als g ltig behandeln Benutzerdefinierte fehlende Werte werden als g ltige Werte behandelt Richtlinie f r fehlende Werte Die folgen
32. beobachtet werden dass die Daten keine Saisonalit t aufweisen Damit besteht keine Notwendigkeit saisonale Modelle zu ber cksichtigen Dies verringert den Raum der Modelle der von Expert Modeler durchsucht wird und die Zeit f r die Berechnung wird deutlich verringert Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Zeitreihenmodellierung auf die Registerkarte Optionen 53 Prognosen f r gro e Datenmengen mit dem Expert Modeler Abbildung 6 5 Zeitreihenmodellierung Registerkarte Optionen E Zeitreihenmodellierung Variablen Statistik Diagramme Ausgabefilter Speichern Optionen Vorhersageperiode O Erster Fall nach der Sch tzperiode bis letzter Fall in der Arbeitsdatei Erster Fall nach der Sch tzperiode bis zum angegebenen Datum Datum u ee Jahr Monat Benutzerdefinierte fehlende Werte R x Konfidenzintervallbreite 95 Als ung ltig behandeln Pr fix f r Modellbezeichner in Modell Als g ltig behandeln micas In ACF und PACF Ausgabe 24 angezeigte maximale Anzahl von Intervallen gt Wahlen Sie im Gruppenfeld Vorhersageperiode die Option Erster Fall nach der Schatzperiode bis zum angegebenen Datum aus gt Geben Sie im Datumsgitter f r das Jahr 2004 und f r den Monat 3 ein Das Daten Set enth lt Daten von Januar 1999 bis Dezember 2003 Mit den aktuellen Einstellungen erstreckt sich die Vorhersageperiode von Januar 2004 bis M rz 2004
33. derselben Zeitreihe Anhang Ausrei ertypen In diesem Abschnitt finden Sie Definitionen der Ausrei ertypen die bei der Zeitreihenmodellierung verwendet werden Additiv Ein Ausrei er der eine einzelne Beobachtung beeinflusst So k nnte z B ein Fehler bei der Datenkodierung als additiver Ausrei er identifiziert werden Niveauverschiebung Ein Ausrei er der beginnend an einer bestimmten Stelle der Zeitreihe alle Beobachtungen um eine Konstante verschiebt Eine Niveauverschiebung k nnte sich aus einem Strategiewechsel ergeben Innovativ Neuerung Ein Ausrei er der als Zuwachs zum Rauschen an einer bestimmten Stelle der Zeitreihe wirkt Bei station ren Zeitreihen beeinflusst ein innovativer Ausrei er mehrere Beobachtungen Bei nichtstation ren Zeitreihen kann er alle Beobachtungen ab einer bestimmten Stelle der Zeitreihe beeinflussen Transient Ein Ausrei er dessen Auswirkung exponentiell gegen null strebt Saisonal additiv Ein Ausrei er der eine bestimmte Beobachtung beeinflusst sowie alle folgenden Beobachtungen die von dieser eine oder mehrere Perioden entfernt sind Alle diese Beobachtungen werden in gleicher Weise beeinflusst Ein saisonal additiver Ausrei er k nnte auftreten wenn ab einem bestimmten Jahr die Ums tze jeden Januar h her sind Lokaler Trend Ein Ausrei er der an einer bestimmten Stelle der Zeitreihe einen lokalen Trend ausl st Additiver Bereich Eine Gruppe von zwei oder mehr aufein
34. es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Mobiltelefonunternehmens geht die Kundenabwanderung zu verringern Scores f r die Abwanderungsneigung von 0 bis 100 werden auf die Kunden angewendet Kunden mit einem Score von 50 oder h her streben vermutlich einen Anbieterwechsel an ceramics sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Herstellers geht der ermitteln m chte ob ein neue hochwertige Keramiklegierung eine gr ere Hitzebest ndigkeit aufweist als eine Standardlegierung Jeder Fall entspricht einem Test einer der Legierungen die Temperatur bei der das Keramikw lzlager versagte wurde erfasst cereal sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Umfrage geht bei der 880 Personen nach ihren Fr hst ckgewohnheiten befragt wurden Au erdem wurden Alter Geschlecht Familienstand und Vorliegen bzw Nichtvorliegen eines aktiven Lebensstils auf der Grundlage von mindestens zwei Trainingseinheiten pro Woche erfasst Jeder Fall entspricht einem Teilnehmer 111 Beispieldateien clothing_defects sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Qualit tskontrolle in einer Bekleidungsfabrik geht Aus jeder in der Fabrik produzierten Charge entnehmen die Kontrolleure eine Stichprobe an Bekleidungsartikeln und z hlen die Anzahl der Bekleidungsartikel die inakzeptabel sind co
35. gt Geben Sie im Datumsgitter f r das Jahr 2004 und f r den Monat 6 ein Das Daten Set enth lt Daten von Januar 1999 bis M rz 2004 Mit den aktuellen Einstellungen erstreckt sich die Vorhersageperiode von April 2004 bis Juni 2004 gt Klicken Sie auf die Registerkarte Speichern Abbildung 7 2 Zeitreihenmodell zuweisen Registerkarte Speichern E Zeitreihenmodell zuweisen EE Modelle Statistik Diagramme Ausgabefilter Speichern Optionen Variablen speichern Variablen Beschreibung Speichern Prafix fiir Variablennamen Vorhergesagte Werte vV __ Vorhersagewert Untere Konfidenzgrenzen Obere Konfidenzgrenzen F r jedes ausgew hlte Element wird je abh ngiger Yariablen eine Yariable gespeichert Modelldatei mit erneut gesch tzten Parametern exportieren gt Aktivieren Sie in der Spalte Speichern den Eintrag Vorhergesagte Werte und behalten Sie den Standardwert Vorhersagewert als Pr fix f r Variablennamen bei Die Modellvorhersagen werden als neue Variablen in der Arbeitsdatei gespeichert wobei Vorhersagewert als Pr fix f r die Variablennamen verwendet wird gt Klicken Sie auf die Registerkarte Diagramme 63 Abbildung 7 3 Neuprognosen f r gro e Datenmengen durch das Zuweisen gespeicherter Modelle Zeitreihenmodell zuweisen Registerkarte Diagramme E Zeitreihenmodellierung SS Variablen Statistik Diagramme Ausgabefilter Speichern Optionen
36. gt SPSS Trends 16 0 Weitere Informationen zu SPSS Software Produkten finden Sie auf unserer Website unter der Adresse http www spss com oder wenden Sie sich an SPSS Inc 233 South Wacker Drive 11th Floor Chicago IL 60606 6412 USA Tel 312 651 3000 Fax 312 651 3668 SPSS ist eine eingetragene Marke und weitere Produktnamen sind Marken der SPSS Inc fiir Computerprogramme von SPSS Inc Die Herstellung oder Verbreitung von Materialien die diese Programme beschreiben ist ohne die schriftliche Erlaubnis des Eigent mers der Marke und der Lizenzrechte der Software und der Copyrights der ver ffentlichten Materialien verboten Die SOFTWARE und die Dokumentation werden mit BESCHR NKTEN RECHTEN zur Verf gung gestellt Verwendung Vervielf ltigung und Ver ffentlichung durch die Regierung unterliegen den Beschr nkungen in Unterabschnitt c 1 ii von The Rights in Technical Data and Computer Software unter 52 227 7013 Vertragspartner Hersteller ist SPSS Inc 233 South Wacker Drive 11th Floor Chicago IL 60606 6412 Patentnr 7 023 453 Allgemeiner Hinweis Andere in diesem Dokument verwendete Produktnamen werden nur zu Identifikationszwecken genannt und k nnen Marken der entsprechenden Unternehmen sein Windows ist eine eingetragene Marke der Microsoft Corporation Apple Mac und das Mac Logo sind Marken von Apple Computer Inc die in den USA und in anderen L ndern eingetragen sind Dieses Produkt verwende
37. higkeit erfolgreich derartige Vorhersagen zu treffen ist offensichtlich f r jeden Betrieb und alle wissenschaftlichen Bereiche von gro er Bedeutung Zeitreihendaten Wenn Sie Zeitreihendaten f r die Verwendung im Erweiterungsmodul Trends definieren entspricht jede Zeitreihe einer separaten Variablen Um beispielsweise eine Zeitreihe im Daten Editor zu definieren klicken Sie auf die Registerkarte Variablenansicht und geben Sie in eine beliebige leere Zeile einen Variablennamen ein Jede Beobachtung in einer Zeitreihe entspricht einem Fall einer Zeile im Daten Editor 2 Kapitel 1 Wenn Sie eine Tabelle mit Zeitreihendaten ffnen sollte jede Zeitreihe in einer Spalte der Tabelle angeordnet sein Wenn Sie bereits eine Tabelle mit Zeitreihen in Zeilen besitzen k nnen Sie sie dennoch ffnen und mit der Funktion Transponieren im Men Daten die Zeilen in Spalten umwandeln Transformieren von Daten Eine Reihe der im Base System zur Verf gung stehenden Prozeduren f r Datentransformationen k nnen bei der Analyse von Zeitreihen n tzlich sein m Die Prozedur Datum definieren im Men Daten erzeugt Datumsvariablen zum Erstellen von Periodizit t und zum Unterscheiden zwischen historischen Perioden Validierungsperioden und Vorhersageperioden Trends wurde f r die Arbeit mit den durch die Prozedur Datum definieren erstellten Daten entwickelt m Die Prozedur Zeitreihen erstellen im Men
38. lediglich gepr ft werden Die Sch tzperiode besteht aus den aktuell ausgew hlten F llen in der Arbeitsdatei Alle verbleibenden F lle die auf den letzten ausgew hlten Fall folgen k nnen als Pr ff lle verwendet werden Wenn Sie feststellen dass das Modell hinreichende Vorhersagen liefert k nnen Sie die Sch tzperiode um die Pr ff lle erweitern und anschlie end das endg ltige Modell erstellen Erstellen von Modellen und Vorhersagen Das Erweiterungsmodul Trends bietet zwei Prozeduren um Modelle zu erstellen und Vorhersagen zu treffen 3 Einf hrung in Zeitreihen m Die Prozedur Zeitreihenmodellierung erstellt Modelle f r Zeitreihen und erm glicht Vorhersagen Sie enth lt den Expert Modeler der automatisch das beste Modell f r jede der Zeitreihen bestimmt Erfahrene Analysten die ein gr eres Ma an Kontrolle w nschen finden im Expert Modeler au erdem Werkzeuge zum Erstellen von benutzerdefinierten Modellen m Die Prozedur Zeitreihenmodell zuweisen wendet vorhandene mit der Prozedur Zeitreihenmodellierung erstellte Zeitreihenmodelle auf die Arbeitsdatei an Hierbei k nnen Sie Vorhersagen f r Zeitreihen berechnen f r neue oder berarbeitete Daten verf gbar sind ohne die Modelle erneut zu erstellen Wenn Sie Grund zu der Annahme haben dass sich ein Modell ver ndert hat k nnen Sie es mit der Prozedur Zeitreihenmodellierung erneut erstellen Kapitel Zeitreihenmodellierung
39. und MA Koeffizienten ab In einigen F llen wechselt eine exponentiell abnehmende ACF zwischen positiven und negativen Werten ACF und PACF Diagramme aus echten Daten sind nie so sauber wie die hier gezeigten Diagramme Sie m ssen lernen aus dem jeweiligen Diagramm das Wesentliche herauszusuchen berpr fen Sie stets die ACF und PACF der Residuen f r den Fall dass Ihre Identifizierung falsch ist Beachten Sie m Saisonale Prozesse zeigen diese Muster in den saisonalen Lags den Mehrfachen der Saison Periode m Sie d rfen nichtsignifikante Werte als 0 behandeln d h Sie k nnen Werte ignorieren die im Diagramm innerhalb der Konfidenzintervalle liegen Sie m ssen sie jedoch nicht ignorieren insbesondere wenn Sie das Muster der statistisch signifikanten Werte fortsetzen m Einzelne Autokorrelationen sind schon durch Zufall statistisch signifikant Sie k nnen eine statistisch signifikante Autokorrelation ignorieren wenn sie isoliert vorkommt insbesondere in hohen Lags und wenn sie nicht in einem saisonalen Lag auftritt 104 105 bersicht ber ACF PACF Diagramme Detailliertere Erl uterungen zu ACF und PACF Diagrammen finden Sie in jedem beliebigen Text zur ARIMA Analyse ARIMA 0 0 1 6 gt 0 PACF 7 ARIMA 0 0 1 6 lt 0 PACF T IE 106 Anhang C i i i ARIMA 0 0 2 6362 gt 0 1 a ARIMA 1 0 0 6 gt 0 i ARIMA 1 0 0 6 lt 0 PACF PACF PACF
40. zusammenh ngende gro e Term entfernt wird Bivariate Analyse Erste Variable mit jeder Wenn Sie zwei oder mehr Variablen ausgew hlt haben k nnen Sie diese Option aktivieren um eine bivariate Spektralanalyse berechnen zu lassen m Die erste Variable in der Liste Variable n wird als unabh ngige Variable behandelt und alle brigen Variablen gelten als abh ngige Variablen m Jede auf die erste Zeitreihe folgende Zeitreihe wird unabh ngig von anderen festgelegten Zeitreihen mit der ersten Zeitreihe analysiert Au erdem werden univariate Analysen jeder Zeitreihe durchgef hrt Diagramm Periodogramm und Spektraldichte sind sowohl f r univariate und bivariate Analysen verf gbar Alle anderen Optionen stehen nur f r bivariate Analysen zur Verf gung m Periodogramm Ein ungegl ttetes Diagramm der Spektralamplitude dargestellt auf einer logarithmischen Skala in Abh ngigkeit von Frequenz oder Periode Eine niederfrequente Streuung charakterisiert eine glatte Zeitreihe Eine gleichm ig ber alle Frequenzen verteilte Streuung ist ein Zeichen f r wei es Rauschen m Quadratische Koh renz Das Produkt der Zunahmewerte der beiden Zeitreihen Quadraturspektrum Der Imagin rteil des Kreuzperiodogramms er ist ein Ma f r die Korrelation der phasenverschobenen Frequenzkomponenten der beiden Zeitreihen Die Komponenten sind um pi 2 phasenverschoben Kreuzamplitude Die Wurzel aus der Summe von quadrierter Kospektraldi
41. Anteil der H lfte der Spannweite und Dp ist der Dirichlet Kern der Ordnung p m Tukey Die Gewichte lauten Wk 0 5Dp 2 pi fk 0 25Dp 2 pi fk pi p 0 25Dp 2 pi fk pi p f r k 0 p Hierbei ist p der ganzzahlige Teil der Spannweitenh lfte und Dp ist der Dirichlet Kern der Ordnung p m Parzen Die Gewichtungen sind Wk 1 p 2 cos 2 pi fk F p 2 2 pi fk 2 fiir k 0 p Dabei ist p der ganzzahlige Teil der halben Spannweite und F p 2 ist der Fej rsche Kern der Ordnung p 2 m Bartlett Die Form eines Spektralfensters bei dem die Gewichte der oberen H lfte gleich Wk Fp 2 pi fk fiir k 0 p sind Dabei bezeichnet p den ganzzahligen Anteil der halben Spannweite Fp ist der Fejer sche Kern der Ordnung p Die untere H lfte des Fensters ist symmetrisch zur oberen 46 Kapitel 5 Daniell Einheit Die Form eines Spektralfensters f r das alle Gewichtungen gleich 1 sind m Keine Keine Gl ttung Wenn diese Option ausgew hlt wird entspricht die Sch tzung der Spektraldichte dem Periodogramm Spanne Der Bereich aufeinanderfolgender Werte f r den die Gl ttung durchgef hrt wird In der Regel werden ungerade ganze Zahlen verwendet Bei gr eren Spannweiten ist die Gl ttung der Spektraldichte Diagramme gr er als bei kleineren Spannweiten Variablen zentrieren Passt die Zeitreihe so an dass sie vor der Berechnung des Spektrums den Mittelwert 0 hat sodass der eventuell mit dem Mittelwert
42. Anzahl der Abonnenten eines Breitband Service nach Region geordnet enth lt Die Datendatei enth lt die monatlichen Abonnentenzahlen f r 85 Regionen ber einen Zeitraum von vier Jahren broadband_2 sav Diese Datendatei stimmt mit broadband_1 sav berein enth lt jedoch Daten f r weitere drei Monate 110 Anhang D car_insurance_claims sav Ein an anderer Stelle McCullagh als auch Nelder 1989 vorgestelltes und analysiertes Daten Set bezieht sich auf Schadensanspr che f r Autos Die durchschnittliche H he der Schadensanspr che l sst sich mit Gamma Verteilung modellieren Dazu wird eine inverse Verkn pfungsfunktion verwendet um den Mittelwert der abh ngigen Variablen mit einer linearen Kombination aus Alter des Versicherungsnehmers Fahrzeugtyp und Fahrzeugalter in Bezug zu setzen Die Anzahl der eingereichten Schadensanspr che kann als Skalierungsgewicht verwendet werden car_sales sav Diese Datendatei enth lt hypothetische Verkaufssch tzer Listenpreise und physische Spezifikationen f r verschiedene Fahrzeugfabrikate und modelle Die Listenpreise und physischen Spezifikationen wurden von edmunds com und Hersteller Websites entnommen carpet sav In einem beliebten Beispiel m chte Green als auch Wind 1973 einen neuen Teppichreiniger vermarkten und dazu den Einfluss von f nf Faktoren auf die Bevorzugung durch den Verbraucher untersuchen Verpackungsgestaltung Markenname Preis G tesiegel Good Housekeeping und G
43. C Wurzel der mittleren Fehler Quadratsumme _ Normalisiertes BIC C Mittlerer absoluter Fehler in Prozent Residuen Autokorrelationsfunktion ACF Mittlerer absoluter Fehler Part Residuen Autokorrelationsfunktion PACF Diagramme nach einzelnen Modellen C Datenreihen _ Residuen Autokorrelationsfunktion ACF Diagrammanzeige C Part Residuen Autokorrelationsfunktion PACF Die Registerkarte Diagramme enth lt Optionen mit denen Diagramme f r Statistiken zur G te der Anpassung Autokorrelationsfunktionen und Zeitreihenwerte einschlie lich Vorhersagen angezeigt werden k nnen Diagramme zum Vergleichen von Modellen Mit dieser Gruppe von Optionen wird die Anzeige der Diagramme gesteuert die die Statistiken f r alle Modelle enthalten Sofern die Modellparameter nicht erneut gesch tzt werden Erneut aus den Daten sch tzen auf der Registerkarte Modelle stammen die angezeigten Werte aus der Modelldatei und entsprechen den Daten die bei der Entwicklung oder letzten Aktualisierung des jeweiligen Modells verwendet wurden Autokorrelationsdiagramme sind zudem nur verf gbar wenn die Modellparameter erneut gesch tzt werden F r jede Option wird ein eigenes Diagramm erstellt Sie k nnen eine oder mehrere der folgenden Optionen ausw hlen m R Quadrat f r station ren Teil R Quadrat Wurzel der mittleren Fehler Quadratsumme Mittlerer absoluter Fehler in Prozent Mittlerer absoluter Fehler 34
44. D W Dockery A Spiro II F E Speizer als auch B G Ferris Jr 1984 Passive smoking gas cooking and respiratory health of children living in six cities American Review of Respiratory Diseases 129 366 374 ACF Diagramme f r reine ARIMA Prozesse 104 in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 Additiver Ausrei er 103 in Zeitreihenmodellierung 9 16 Additiver Bereich Ausrei er 103 in Zeitreihenmodellierung 9 16 Anpassungsg te des Modells Tabelle in Zeitreihenmodell zuweisen 63 Anpassungswerte in Zeitreihenmodell zuweisen 33 in Zeitreihenmodellierung 19 73 ARIMA Modelle 7 Ausrei er 16 autoregressive Ordnungen 13 Differenzierungsordnungen 13 Konstante 13 Ordnungen des gleitenden Durchschnitts 13 saisonale Ordnungen 13 bertragungsfunktionen 14 ARIMA Modellparameter Tabelle in Zeitreihenmodellierung 76 Ausrei er ARIMA Modelle 16 Definitionen 103 Expert Modeler 9 70 Autokorrelationsfunktion Diagramme f r reine ARIMA Prozesse 104 in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 Autoregression ARIMA Modelle 13 Beispieldateien Speicherort 108 Box Ljung Statistik in Zeitreihenmodell zuweisen 31 in Zeitreihenmodellierung 17 75 Differenztransformation ARIMA Modelle 13 Einfaches Modell mit exponentiellem Gl tten 10 Einfaches saisonales Modell mit exponentiellem Gl tten 10 Ereignisse 9 in Zeitreihenmode
45. Die Prozedur Zeitreihenmodellierung sch tzt Modelle f r die exponentielle Gl ttung die univariate ARIMA Autoregressive Integrated Moving Average und die multivariate ARIMA oder bertragungsfunktionsmodelle f r Zeitreihen und erstellt Prognosen Die Prozedur enth lt den Expert Modeler der f r eine oder mehrere abh ngige Variablenreihen automatisch das jeweils am besten angepasste Modell f r die ARIMA oder die exponentielle Gl ttung ermittelt und sch tzt sodass das geeignete Modell nicht mehr nach dem Prinzip von Versuch und Irrtum ermittelt werden muss Sie k nnen auch ein benutzerdefiniertes ARIMA Modell oder ein Modell der exponentiellen Gl ttung angeben Beispiel Als Produktmanager ist es Ihre Aufgabe f r 100 verschiedene Produkte die Verkaufsst ckzahlen und Verkaufserl se f r den Folgemonat vorherzusagen Sie verf gen jedoch nur ber geringe oder gar keine Erfahrungen in der Zeitreihenmodellierung Die historischen Verkaufsst ckzahlen f r alle 100 Produkten sind in einem einzigen Excel Arbeitsblatt gespeichert Nachdem Sie das Arbeitsblatt in SPSS ge ffnet haben fordern Sie im Expert Modeler Vorhersagen f r den n chsten Monat an Der Expert Modeler ermittelt f r jedes Produkt das beste Modell f r die Verkaufsst ckzahlen und erstellt anhand dessen die Vorhersagen Der Expert Modeler kann mehrere Eingabereihen verarbeiten sodass Sie die Prozedur nur einmal ausf hren m ssen um Vorhersagen f r s mtliche Produkt
46. IC C Residuen Autokorrelationsfunktion ACF Part Residuen Autokorrelationsfunktion PACF C Residuen Autokorrelationsfunktion ACF Part Residuen Autokorrelationsfunktion PACF sehen Die Registerkarte Diagramme bietet Optionen fiir die Anzeige von Diagrammen der Modellierungsergebnisse Diagramme zum Vergleichen von Modellen Mit dieser Gruppe von Optionen wird die Anzeige der Diagramme gesteuert die die f r alle Modelle berechneten Statistiken enthalten F r jede Option wird ein eigenes Diagramm erstellt Sie k nnen eine oder mehrere der folgenden Optionen ausw hlen m R Quadrat f r station ren Teil R Quadrat Mittlerer absoluter Fehler Wurzel der mittleren Fehler Quadratsumme Mittlerer absoluter Fehler in Prozent 20 Kapitel 2 Maximaler absoluter Fehler in Prozent Maximaler absoluter Fehler Normalisiertes BIC Residuen Autokorrelationsfunktion ACF Part Residuen Autokorrelationsfunktion PACF F r weitere Informationen siehe Ma e f r die Anpassungsg te in Anhang A auf S 101 Diagramme nach einzelnen Modellen Datenreihen Aktivieren Sie diese Option um f r die einzelnen gesch tzten Modelle Diagramme der vorhergesagten Werte zu erhalten Sie k nnen eine oder mehrere der folgenden Optionen f r die Aufnahme in das Diagramm ausw hlen Beobachtete Werte Die beobachteten Werte der abh ngigen Zeitreihe Vorhersagen Die vom Modell vorhergesagten Werte f r die Vorhe
47. Jeder Fall in der Datendatei enth lt die Gemeinde in der sich die Immobilie befindet den Bewerter der die Immobilie besichtigt hat die seit dieser Bewertung verstrichene Zeit den zu diesem Zeitpunkt ermittelten Wert sowie den Verkaufswert der Immobilie property_assess_cs sav Hierbei handelt es sich um eine hypothetische Datendatei in der es um die Bem hungen eines f r einen US Bundesstaat zust ndigen Immobilienbewerters geht trotz eingeschr nkter Ressourcen die Einsch tzungen des Werts von Immobilien auf dem aktuellsten Stand zu halten Die F lle entsprechen den Immobilien in dem betreffenden Bundesstaat Jeder Fall in der Datendatei enth lt das County die Gemeinde und das Wohnviertel in dem sich die Immobilie befindet die seit der letzten Bewertung verstrichene Zeit sowie zu diesem Zeitpunkt ermittelten Wert property_assess_cs_sample sav Diese hypothetische Datendatei enth lt eine Stichprobe der in property_assess_cs sav aufgef hrten Immobilien Die Stichprobe wurde gem dem in der Plandatei property_assess csplan angegebenen Stichprobenplan gezogen und in dieser Datendatei sind die Einschlusswahrscheinlichkeiten und Stichprobengewichtungen erfasst Die zus tzliche Variable Current value Aktueller Wert wurde nach der Ziehung der Stichprobe erfasst und zur Datendatei hinzugef gt 116 Anhang D recidivism sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Strafverfol
48. OK Dadurch wird die Periodizit t auf 12 gesetzt und eine Menge von Datumsvariablen f r die Arbeit mit den Prozeduren von Trends erstellt Durchf hrung der Analyse So f hren Sie die Prozedur Saisonale Zerlegung durch W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Saisonale Zerlegung 93 Saisonale Zerlegung Abbildung 10 7 Dialogfeld Saisonale Zerlegung E Saisonale Zerlegung L women men gs jewel E mail F page Modelltyp E phone L print Muttiplikativ L service O Additiv ad a Gewichtung f r gleitenden Durchschnit Alle Punkte gleich Endpunkte gewichtet mit 0 5 Aktuelle Periodizit t 12 Fallweise Auflistung ox Einf gen Zur cksetzen J Abbrechen gt Klicken Sie mit der rechten Maustaste auf eine beliebige Stelle in der Quellvariablenliste und w hlen Sie im Kontextmen die Option Variablennamen anzeigen aus W hlen Sie die Variable men aus und verschieben Sie sie in die Liste Variablen W hlen Sie im Gruppenfeld Modelltyp die Option Multiplikativ Klicken Sie auf OK Interpretation der Ausgabe Die Prozedur Saisonale Zerlegung erstellt vier neue Variablen f r jede von der Prozedur analysierte urspr ngliche Variable In der Standardeinstellung werden die neuen Variablen zur Arbeitsdatei hinzugef gt Die Namen der neuen Zeitrei
49. Registerkarte Variablen mindestens eine abh ngige Variable f r die Modellierung aus gt W hlen Sie in der Dropdown Liste Methode eine Modellierungsmethode aus bernehmen Sie f r automatische Modellierung die Standardmethode des Expert Modeler Der Expert Modeler ermittelt dann f r jede abh ngige Variable das am besten angepasste Modell So erstellen Sie Vorhersagen Klicken Sie auf die Registerkarte Optionen gt Geben Sie die Vorhersageperiode an Es wird ein Diagramm mit Vorhersagen und beobachteten Werten erstellt Die folgenden Optionen sind verf gbar m W hlen Sie mindestens eine unabh ngige Variable aus Unabh ngige Variablen werden weitgehend wie Pr diktoren in der Regressionsanalyse behandelt sind jedoch optional Sie k nnen in ARIMA Modelle nicht jedoch in Modelle mit exponentiellem Gl tten eingeschlossen werden Wenn Sie Expert Modeler als Modellierungsmethode angeben und unabh ngige Variablen einschlie en werden nur ARIMA Modelle ber cksichtigt m Klicken Sie zum Angeben der Modellierungsdetails auf Kriterien m Speichern von Vorhersagen Konfidenzintervallen und Residuum Rauschen 7 Zeitreihenmodellierung m Speichern der gesch tzten Modelle im XML Format Gespeicherte Modelle k nnen neuen oder korrigierten Daten zugewiesen werden um aktualisierte Vorhersagen ohne Neuerstellen der Modelle zu erhalten Hierf r k nnen Sie die Prozedur Zeitreihenmodell zuweisen verwenden Erste
50. Regression behindern pain_medication sav Diese hypothetische Datendatei enth lt die Ergebnisse eines klinischen Tests f r ein entztindungshemmendes Medikament zur Schmerzbehandlung bei chronischer Arthritis Von besonderem Interesse ist die Zeitdauer bis die Wirkung des Medikaments einsetzt und wie es im Vergleich mit bestehenden Medikamenten abschneidet patient_los sav Diese hypothetische Datendatei enth lt die Behandlungsaufzeichnungen zu Patienten die wegen des Verdachts auf Herzinfarkt in das Krankenhaus eingeliefert wurden Jeder Fall entspricht einem Patienten und enth lt diverse Variablen in Bezug auf den Krankenhausaufenthalt 115 Beispieldateien patlos_sample sav Diese hypothetische Datendatei enth lt die Behandlungsaufzeichnungen f r eine Stichprobe von Patienten denen w hrend der Behandlung eines Herzinfarkts Thrombolytika verabreicht wurden Jeder Fall entspricht einem Patienten und enth lt diverse Variablen in Bezug auf den Krankenhausaufenthalt polishing sav Hierbei handelt es sich um die Datendatei Nambeware Polishing Times aus der Data and Story Library Sie bezieht sich auf die Bem hungen eines Herstellers von Metallgeschirr Nambe Mills Santa Fe New Mexico zur zeitlichen Planung seiner Produktion Jeder Fall entspricht einem anderen Artikel in der Produktpalette F r jeden Artikel sind Durchmesser Polierzeit Preis und Produkttyp erfasst poll_cs sav Hierbei handelt es sich um eine hypothet
51. Summe der Verkaufszahlen w hrend der vier Wochen der Studie tree_car sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten sowie Daten zum Kaufpreis von Fahrzeugen enth lt tree_credit sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten sowie Daten zu fr heren Bankkrediten enth lt tree_missing_data sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten sowie Daten zu fr heren Bankkrediten enth lt und eine gro e Anzahl fehlender Werte aufweist tree_score_car sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten sowie Daten zum Kaufpreis von Fahrzeugen enth lt tree_textdata sav Eine einfache Datendatei mit nur zwei Variablen die vor allem den Standardzustand von Variablen vor der Zuweisung von Messniveau und Wertelabels zeigen soll tv survey sav Hierbei handelt es sich um eine hypothetische Datendatei zu einer Studie die von einem Fernsehstudio durchgef hrt wurde das berlegt ob die Laufzeit eines erfolgreichen Programms verl ngert werden soll 906 Personen wurden gefragt ob sie das Programm unter verschiedenen Bedingungen ansehen w rden Jede Zeile entspricht einem Befragten jede Spalte entspricht einer Bedingung ulcer_recurrence sav Diese Datei enth lt Teilinformationen aus einer Studie zum Vergleich der Wirksamkeit zweier Therapien zur Vermeidung des Wiederauftretens von Geschw ren
52. Wenn Sie das vorhergehende Beispiel durchgearbeitet und eine eigene Modelldatei gespeichert haben k nnen Sie selbstverst ndlich anstelle von catalog _model xml Ihre eigene Datei verwenden Erweitern der Pr diktorzeitreihe Beim Erstellen von Vorhersagen f r abh ngige Datenreihen mit Einflussvariablen muss jede Pr diktorzeitreihe ber die Vorhersageperiode hinaus erweitert werden Wenn Ihnen die zuk nftigen Werte der Einflussvariablen nicht genau bekannt sind m ssen Sie diese sch tzen Anschlie end k nnen Sie die Sch tzwerte ndern und so verschiedene Szenarien mit 77 78 Kapitel 9 Einflussvariablen testen Die anf nglichen Prognosen k nnen einfach mit dem Expert Modeler erstellt werden gt Wahlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Modelle erstellen Abbildung 9 1 Dialogfeld Zeitreihenmodellierung E Zeitreihenmodellierung Variablen Statistik Diagramme Ausgabefilter Speichern Optionen Yariablen Abh ngige Variablen Gate date E Number of Pages in Catalog page E Sales of Men s Clothing men E Number of Phone Lines Open for Orde date date E Sales of Men s Clothing men E Sales of Women s Clothing women E Number of Catalogs Mailed mail L Sales of Jewelry jewel L Amount Spent on Print Advertising E Number of Customer Service Repr YEAR not periodic YEAR QMONTH period 12 MONTH E Error From Seasonal Decompositi
53. absolute Fehler in Prozent variiert ber alle Modelle zwischen einem Minimum von 0 669 und einem Maximum von 1 026 Der maximale absolute Fehler in Prozent variiert ber alle Modelle zwischen 1 742 und 4 373 Die mittlere Unsicherheit in den Vorhersagen der einzelnen Modelle betr gt daher etwa 1 und die maximale Unsicherheit liegt bei etwa 2 5 dem Mittelwert von MaxAPE wobei der schlechteste anzunehmende Fall bei etwa 4 liegt Ob diese Werte einer akzeptablen Unsicherheit entsprechen ist von dem Risiko abh ngig das Sie zu akzeptieren bereit sind Modellvorhersagen Abbildung 7 5 Neue Variablen mit Modellvorhersagen YEAR_ MONTH_ DATE_ Vorhersagewert_Market_ Vorhersagewert_Market_2_ 2 1_Modell_1 Modell_2 2004 1 JAN 2004 11513 54947 2004 2 FEB 2004 11806 56810 2004 3 MAR 2004 11950 57344 2004 4 APR 2004 12312 59631 2004 5 MAY 2004 12501 60717 2004 6 JUN 2004 12689 61659 Der Daten Editor zeigt die neuen Variablen an die die Modellvorhersagen enthalten Auch wenn hier nur zwei gezeigt werden sind 85 neue Variablen vorhanden eine f r jede der 85 abh ngigen Zeitreihen Die Variablennamen bestehen aus dem Standardpr fix Vorhersagewert gefolgt vom Namen der verkn pften abh ngigen Variable zum Beispiel Market_ und einem Modellbezeichner zum Beispiel Modell_ Dem Daten Set wurden drei neue F lle mit den Vorhersagen von April 2004 bis Juni 2005 und automatisch erzeugten Datenlabels hinzugef gt Zusammenfassun
54. adrat Ein Sch tzer f r den Anteil der Gesamtvariation der Zeitreihe der durch das Modell erkl rt wird Dieses Ma ist sehr n tzlich wenn die Zeitreihe station r ist R Quadrat kann auch negativ sein es nimmt Werte zwischen minus unendlich und 1 an Negative Werte bedeuten dass das betrachtete Modell schlechter ist als das Basismodell Positive Werte bedeuten dass das betrachtete Modell besser ist als das Basismodell RMSE Steht f r Root Mean Square Error die Wurzel des mittleren quadratischen Fehlers Die Quadratwurzel des mittleren Fehlerquadrats Ein Ma daf r wie stark eine abh ngige Zeitreihe von ihrem durch das Modell vorhergesagten Niveau abweicht und zwar ausgedr ckt in derselben Ma einheit wie die abh ngige Zeitreihe MAPE Mittlerer absoluter Fehler in Prozent Ein Ma daf r wie stark eine abh ngige Zeitreihe von ihrem durch das Modell vorhergesagten Niveau abweicht Es ist unabh ngig von den verwendeten Ma einheiten und kann daher verwendet werden um Zeitreihen mit unterschiedlichen Einheiten zu vergleichen MAE Mean Absolute Error also mittlerer absoluter Fehler bzw mittlerer Betrag des Fehlers Er misst wie stark die Zeitreihe von ihrem durch das Modell vorhergesagten Niveau abweicht MAE wird in derselben Ma einheit angegeben wie die urspr ngliche Zeitreihe MaxAPE Maximaler absoluter Fehler in Prozent Maximum Absolute Percentage Error also maximaler Betrag des relativen Fehlers Dies ist der gr
55. age Die Daten f r Baubeginne weisen typischerweise eine starke saisonale Komponente auf Sind jedoch auch l ngere Zyklen in den Daten zu finden deren sich die Analytiker bei der Auswertung der aktuellen Zahlen bewusst sein m ssen Statistiken Sinus und Kosinus Transformationen Periodogramm Wert und Spektraldichtesch tzer f r jede Frequenz bzw Periodenkomponente Wenn eine bivariate Analyse ausgew hlt ist Real und Imagin rteile des Kreuzperiodogramms Kospektraldichte Quadraturspektrum Quadrierte Koh renz und Phasenspektrum f r jede Frequenz bzw Periodenkomponente Diagramme F r univariate und bivariate Analysen Periodogramm und Spektraldichte F r bivariate Analysen quadrierte Koh renz Quadraturspektrum Kreuzamplitude Kospektraldichte Phasenspektrum und Gewinn Daten Die Variablen m ssen numerisch sein Annahmen Die Variablen d rfen keine eingebetteten fehlenden Daten enthalten Die zu analysierende Zeitreihe muss station r sein und ein Mittelwert ungleich 0 muss aus der Zeitreihe subtrahiert werden m Station r Eine Bedingung die von Zeitreihen eingehalten werden muss an die ARIMA Modelle angepasst werden sollen Reine MA Reihen sind station r aber AR und ARMA Reihen k nnen auch nichtstation r sein Eine station re Zeitreihe besitzt einen konstanten Mittelwert und eine konstante Varianz ber die Zeit Berechnen einer Spektralanalyse W hlen Sie die folgenden Befehle aus den Men s aus An
56. ageperioden Wenn die Vorhersageperiode die L nge der abh ngigen Zeitreihe berschreitet werden neue F lle hinzugef gt Wenn die neuen Variablen gespeichert werden sollen aktivieren Sie jeweils das zugeh rige Kontrollk stchen Speichern In der Standardeinstellung werden keine neuen Variablen gespeichert m Vorhergesagte Werte Die vom Modell vorhergesagten Werte m Untere Konfidenzgrenzen Die unteren Konfidenzgrenzen f r die vorhergesagten Werte m Obere Konfidenzgrenzen Die oberen Konfidenzgrenzen f r die vorhergesagten Werte Residuum Rauschen Die Modellresiduen Bei der Transformation von abh ngigen Variablen z B mit nat rlichem Logarithmus sind dies die Residuen f r die transformierte Reihe m Pr fix f r Variablennamen Geben Sie Pr fixe f r die Namen der neuen Variablen an oder bernehmen Sie die Standardpr fixe Variablennamen bestehen aus dem Pr fix dem Namen der zugewiesenen abh ngigen Variablen und einem Modellbezeichner Beim Auftreten von Namenskonflikten wird der Variablenname ggf erweitert Das Pr fix muss den Regeln f r g ltige Variablennamen entsprechen Modelldatei exportieren Modellspezifikationen f r alle gesch tzten Modelle werden in die angegebene XML Datei exportiert Mit gespeicherten Modellen k nnen anhand von aktuelleren Daten aktualisierte Vorhersagen erstellt werden Verwenden Sie hierf r die Prozedur Zeitreihenmodell zuweisen 24 Kapitel 2 Optionen Abbildung
57. als auch die am besten angepassten Modelle enthalten 36 Kapitel 3 m Feste Anzahl von Modellen Gibt an dass Ergebnisse f r die n am besten angepassten Modelle angezeigt werden Wenn die Anzahl die Gesamtanzahl von Modellen berschreitet werden alle Modelle angezeigt m Prozentsatz der Gesamtanzahl von Modellen Gibt an dass Ergebnisse f r Modelle angezeigt werden deren Werte f r die Anpassungsg te f r alle Modelle in den obersten n Prozent liegen Am schlechtesten angepa te Modelle Aktivieren Sie diese Option um die am schlechtesten angepassten Modelle in die Ausgabe einzuschlie en W hlen Sie ein Ma f r Anpassungsg te und geben Sie die Anzahl von Modellen an die eingeschlossen werden sollen Die Auswahl dieser Option hindert Sie nicht daran auch die am besten angepassten Modelle auszuw hlen Die Ausgabe w rde in diesem Fall sowohl die am besten als auch die am schlechtesten angepassten Modelle enthalten m Feste Anzahl von Modellen Gibt an dass Ergebnisse f r die n am schlechtesten angepassten Modelle angezeigt werden Wenn die Anzahl die Gesamtanzahl von Modellen berschreitet werden alle Modelle angezeigt m Prozentsatz der Gesamtanzahl von Modellen Gibt an dass Ergebnisse f r Modelle angezeigt werden deren Werte f r die Anpassungsg te f r alle Modelle in den untersten n Prozent liegen Ma f r Anpassungsg te W hlen Sie das Ma f r die Anpassungsg te anhand dessen die Modelle gefiltert wer
58. alyse Zeitreihen Spektralanalyse 44 45 Spektraldiagramme Abbildung 5 1 Dialogfeld Spektraldiagramme 3 Spektraldiagramme Yariable n E Sales of Men s Clothing men 2 Date date E Sales of Women s Clothing wom E Sales of Jewelry jewel E Number of Catalogs Mailed mail Spektral Fenster 8 Number of Pages in Catalog page Number of Phone Lines Open for Tukey Hamming 7 v4 Amount Spent on Print Advertisin 8 Number of Customer Service Rep Spanne 5 v Yariablen zentrieren Diagramm v Periodogramm v Spektraldichte G Nach Frequenz Nach Periode OK J Einf gen Zur cksetzen Abbrechen J Hilfe W hlen Sie eine oder mehrere Variablen aus der Liste der verf gbaren Variablen und verschieben Sie sie in die Liste Variable n Achten Sie darauf dass die Liste nur numerische Variablen enth lt W hlen Sie eine der Optionen im Gruppenfeld Spektral Fenster um festzulegen wie das Periodogramm gegl ttet werden soll um eine Spektraldichtesch tzung zu erhalten Folgende Gl ttungsoptionen stehen zur Verf gung Tukey Hamming Tukey Parzen Bartlett Daniell Einheit und Keine Tukey Hamming Die Gewichte lauten Wk 0 54Dp 2 pi fk 0 23Dp 2 pi fk pi p 0 23Dp 2 pi fk pi p f r k 0 p Dabei ist p der ganzzahlige
59. anderfolgenden additiven Ausrei ern Wenn dieser Typ von Ausrei ern gew hlt wird werden neben Gruppen Bereichen von Ausrei ern auch einzelne additive Ausrei er entdeckt 103 Anhang bersicht ber ACF PACF Diagramme Die hier gezeigten Diagramme geh ren zu reinen oder theoretischen ARIMA Prozessen Hier einige allgemeine Richtlinien zur Identifizierung des Prozesses m Nichtstation re Zeitreihen weisen eine ACF auf die ber mindestens ein halbes Dutzend Lags signifikant bleibt anstatt sich schnell dem Wert 0 anzun hern Sie m ssen eine solche Zeitreihe vor dem Identifizieren des Prozesses differenzieren bis sie station r ist m Autoregressive Prozesse weisen eine exponentiell abnehmende ACF und Spikes im ersten Lag oder den ersten Lags der PACF auf Die Anzahl der Spikes gibt die Ordnung der Autoregression an m Prozesse mit gleitendem Durchschnitt Verfahren weisen Spikes im ersten Lag oder den ersten Lags der ACF und eine exponentiell abnehmende PACF auf Die Anzahl der Spikes gibt die Ordnung des gleitenden Durchschnitts an m Gemischte ARMA Prozesse weisen normalerweise eine exponentielle Abnahme sowohl bei der ACF als auch bei der PACF auf In der Identifizierungsphase brauchen Sie sich nicht um das Vorzeichen der ACF bzw PACF oder um die Geschwindigkeit zu k mmern mit der eine exponentiell abnehmende ACF bzw PACF sich dem Wert 0 ann hert Diese h ngt vom Vorzeichen und dem tats chlichen Wert der AR
60. arametersch tzer an F r Modelle mit exponentiellem Gl tten und ARIMA Modelle werden eigene Tabellen angezeigt Wenn Ausrei er vorhanden sind werden Parametersch tzer f r diese ebenfalls in einer eigenen Tabelle angezeigt Residuen Autokorrelationsfunktion ACF Zeigt f r jedes gesch tzte Modell eine Tabelle der Residuen Autokorrelationen nach Intervall an Die Tabelle enth lt die Konfidenzintervalle f r die Autokorrelationen Diese Tabelle ist nur verf gbar wenn die Modellparameter erneut gesch tzt werden Erneut aus den Daten sch tzen auf der Registerkarte Modelle Part Residuen Autokorrelationsfunktion PACF Zeigt f r jedes gesch tzte Modell eine Tabelle der partiellen Residuen Autokorrelationen nach Intervall an Die Tabelle enth lt die Konfidenzintervalle f r die partiellen Autokorrelationen Diese Tabelle ist nur verf gbar wenn die Modellparameter erneut gesch tzt werden Erneut aus den Daten sch tzen auf der Registerkarte Modelle Vorhersagen anzeigen Zeigt eine Tabelle der Modellvorhersagen und der Konfidenzintervalle f r jedes Modell an 33 Zeitreihenmodell zuweisen Diagramme Abbildung 3 3 Zeitreihenmodell zuweisen Registerkarte Diagramme E Zeitreihenmodellierung mans Variablen Statistik Diagramme Ausgabefilter Speichern Optionen Diagramme zum Vergleichen von Modellen OR C Maximaler absoluter Fehler in Prozent EIR Quadrat C Maximaler absoluter Fehler
61. atei eine Periodizit t definiert wurde siehe im Folgenden unter Aktuelle Periodizit t m Z hler Der Z hler Term der bertragungsfunktion Dieser gibt an welche zur ckliegenden Werte aus der ausgew hlten unabh ngigen Zeitreihe Pr diktoren zum Vorhersagen der aktuellen Werte der abh ngigen Zeitreihe verwendet werden Ein Z hler Term von 1 gibt beispielsweise an dass der Wert einer unabh ngigen Zeitreihe die eine Periode zur ckliegt und der aktuelle Wert der unabh ngigen Zeitreihe zum Vorhersagen des aktuellen Werts der einzelnen abh ngigen Zeitreihen verwendet werden m Nenner Der Nenner Term der bertragungsfunktion Dieser gibt an wie Abweichungen vom Mittelwert der Zeitreihe f r zur ckliegende Werte der ausgew hlten unabh ngigen Zeitreihe Pr diktoren zum Vorhersagen der aktuellen Werte der abh ngigen Zeitreihe verwendet werden Ein Nenner Term von 1 gibt beispielsweise an dass beim Vorhersagen der aktuellen Werte f r die einzelnen abh ngigen Zeitreihen Abweichungen vom Mittelwert einer unabh ngigen Zeitreihe ber cksichtigt werden sollen die eine Zeitperiode zur ckliegt m Differenz Gibt die Ordnung der Differenzierung an die vor dem Sch tzen der Modelle auf die ausgew hlte unabh ngige Zeitreihe Pr diktoren angewendet wurde Wenn Trends vorhanden sind ist die Differenzierung erforderlich um die Effekte der Trends zu entfernen Saisonale Ordnungen Saisonale Z hler Nenner und Differenzierung
62. atei f r alle F lle innerhalb der Vorhersageperiode Werte dieser Variablen enthalten Wenn die Modellparameter 27 28 Kapitel 3 erneut gesch tzt werden d rfen die unabh ngigen Variablen in der Sch tzperiode keine fehlenden Werte enthalten Datum definieren F r die Prozedur Zeitreihenmodell zuweisen muss die Periodizit t sofern vorhanden der Arbeitsdatei mit der Periodizit t der zuzuweisenden Modelle bereinstimmen Wenn Sie bei der Vorhersage das gleiche Daten Set m glicherweise mit neuen oder korrigierten Daten verwenden mit dem auch das Modell erstellt wurde ist diese Bedingung erf llt Wenn f r die Arbeitsdatei keine Periodizit t vorliegt k nnen Sie zum Dialogfeld Datum definieren wechseln und dort eine Periodizit t erstellen Wurden die Modelle hingegen ohne Angabe einer Periodizit t erstellt darf die Arbeitsdatei auch keine Periodizit t aufweisen So weisen Sie Modelle zu W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Modelle zuweisen Abbildung 3 1 Zeitreihenmodell zuweisen Registerkarte Modelle EM Zeitreihenmodell zuweisen o Modelle Statistik Diagramme Ausgabefilter Speichern Optionen Modelldatei C ProgrammelsPSS Tutorialisample_files broadband_models xmi Modellparameter und Ma e der G te der Anpassung O Aus Modelldatei laden Erneut aus den Daten sch tzen Sch tzperiode Start Erster Fall Ende Letz
63. beeinflusst wird der 12 Perioden vor dem aktuellen liegt Eine saisonale Ordnung von 1 entspricht bei monatlichen Daten einer nichtsaisonalen Ordnung von 12 Aktuelle Periodizit t Gibt die gegenw rtig f r die Arbeitsdatei definierte Periodizit t an sofern vorhanden Die aktuelle Periodizit t wird als Ganzzahl angegeben z B 12 f r eine j hrliche Periodizit t wobei jeder Fall einen Monat darstellt Wenn keine Periodizit t angegeben wurde wird der Wert Keine angezeigt F r saisonales Modelle muss eine Periodizit t angegeben werden Die Periodizit t wird im Dialogfeld Datum definieren angegeben Transformation abh ngiger Variablen Sie k nnen angeben dass f r alle abh ngigen Variablen vor der Modellierung eine Transformation durchgef hrt wird m Keine Es wird keine Transformation durchgef hrt 14 Kapitel 2 m Quadratwurzel Quadratwurzeltransformation Nat rlicher Logarithmus Transformation mit nat rlichem Logarithmus Konstante in Modell einschlie en Der Einschluss einer Konstanten ist das Standardverfahren sofern Sie nicht sicher wissen dass der Gesamtmittelwert der Zeitreihe 0 ist Bei der Anwendung von Differenzierung empfiehlt es sich die Konstante auszuschlie en bertragungsfunktionen in benutzerdefinierten ARIMA Modellen Abbildung 2 6 Dialogfeld ARIMA Kriterien Registerkarte Ubertragungsfunktion Zeitreihenmodellierung ARIMA Kriterien Modell bertragungsfunktion Ausr
64. beschrieben wird Mit der saisonalen Natur des Modells werden die saisonalen Spitzen ber cksichtigt die im Zeitreihendiagramm zu erkennen waren und die Differenzbildung der ersten Ordnung entspricht dem in den Daten abzulesenden Aufw rtstrend Tabelle der Modellstatistik Abbildung 8 10 Tabelle der Modellstatistik Statistiken zur G te der Anpassung Liung Box Qd1 8 R Quadrat f r Anzahl der station ren Freiheitsg Anzahl der Pr diktoren Teil Statistiken rade Sig Ausrei er Sales ofMen s 7 Clothing Modell_1 2 948 589 18 984 Die Tabelle der Modellstatistik enth lt Auswertungsinformationen und Anpassungsstatistiken f r jedes gesch tzte Modell Die Ergebnisse jedes Modells sind mit dem Modellbezeichner aus der Tabelle der Modellbeschreibung beschriftet Beachten Sie zun chst dass das Modell von den urspr nglich angegebenen f nf potenziellen Einflussvariablen zwei enth lt Der Expert Modeler hat offenbar zwei unabh ngige Variablen ermittelt die f r die Vorhersage sinnvoll sein k nnten Obwohl die Zeitreihenmodellierung verschiedene Anpassungsstatistiken bietet wurde hier lediglich R Quadrat f r den station ren Teil gew hlt Diese Statistik bietet eine Sch tzung des Anteils der Gesamtvariation in der Datenreihe der durch das Modell erkl rt wird Sie ist gegen ber dem normalen R Quadrat vorzuziehen wenn wie im vorliegenden Beispiel ein Trend oder ein saisonales Muster vorliegt Gr ere Werte von R Quadrat f
65. bevor Sie das Modell erstellen Liegen in den Daten saisonale Variationen vor Auch wenn der Expert Modeler f r jede Zeitreihe das beste saisonale oder nichtsaisonale Modell findet k nnen Sie Ergebnisse h ufig schneller berechnen indem Sie die Suche auf nichtsaisonale Modelle begrenzen sofern in den Daten keine Saisonalit t vorliegt Ohne die Daten f r jeden der 85 regionalen M rkte zu untersuchen l sst sich ein grobes Bild der Situation gewinnen in dem die Gesamtzahl der Vertragskunden f r alle M rkte grafisch dargestellt wird W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Sequenzdiagramme 49 50 Kapitel 6 Abbildung 6 1 Dialogfeld Sequenzdiagramme RE Sequenzdiagramme X Yariablen E 9 Subscribers for Market 73 M Total Number of Subscribers T Subscribers for Market 74 M Format Subscribers for Market 75 M E Subscribers for Market 76 M L Subscribers for Market 77 M Zeitachsenbeschriftung Subscribers for Market 78 M e Subscribers for Market 79 M Subscribers for Market 80 M Transformieren amp Subscribers for Market 81 M 9 Subscribers for Market 82 M o Subscribers for Market 83 M C Differenz E Subscribers for Market 84 M 9 Subscribers for Market 85 M C saisonale Differenz E YEAR not periodic YEAR 9 MONTH period 12 MONTH C Nat rlicher Logarithmus Aktu
66. ch eine optionale Transformation die f r diese Variablen ausgef hrt werden soll m Keine Es wird keine Transformation durchgef hrt Quadratwurzel Quadratwurzeltransformation Nat rlicher Logarithmus Transformation mit nat rlichem Logarithmus 16 Kapitel 2 Ausrei er in benutzerdefinierten ARIMA Modellen Abbildung 2 7 Dialogfeld ARIMA Kriterien Registerkarte Ausrei er Zeitreihenmodellierung ARIMA Kriterien Modell bertragungsfunktion Ausrei er Ausrei er automatisch erkennen Zu erkennende Typen von Ausrei ern O Bestimmte Zeitpunkte als AusreiBer modellieren Ausrei erdefinition BE u ee HEHE EEE Auf der Registerkarte Ausrei er sind die folgenden M glichkeiten f r die Behandlung von Ausrei ern verf gbar Pena Tiao als auch Tsay 2001 Ausrei er automatisch erkennen bestimmte Punkte als Ausrei er angeben oder Ausrei er nicht erkennen bzw modellieren Ausrei er nicht erkennen oder modellieren In der Standardeinstellung werden Ausrei er weder erkannt noch modelliert Aktivieren Sie diese Option um die Erkennung und Modellierung von Ausrei ern zu deaktivieren Ausrei er automatisch erkennen Aktivieren Sie diese Option um eine automatische Erkennung von Ausrei ern durchzuf hren und w hlen Sie mindestens einen der folgenden Ausrei ertypen aus Additiv Verschiebung im Niveau Innovativ Transient Saisonal additiv Lokaler Trend Additiver Bereich
67. chte und quadriertem Quadraturspektrum m Spektraldichte Ein Periodogramm das gegl ttet wurde um unregelm ige Variationen zu entfernen m Kospektraldichte Der Realteil des Kreuzperiodogramms er ist ein Ma f r die Korrelation der phasengleichen Frequenzkomponenten der beiden Zeitreihen m Phasenspektrum Ein Ma daf r inwieweit jede Frequenzkomponente einer Zeitreihe der anderen Zeitreihe voraus oder nachl uft Zunahme Gewinn Der Quotient aus Kreuzamplitude und Spektraldichte f r eine der Zeitreihen Jede der beiden Zeitreihen hat einen eigenen Zunahmewert Nach Frequenz Alle Diagramme werden nach der Frequenz erstellt Der Frequenzbereich reicht von 0 der konstante Term oder Mittelwertterm bis 0 5 der Term f r einen Zyklus von zwei Beobachtungen 47 Spektraldiagramme Nach Periode Alle Diagramme werden nach der Periode erstellt Der Periodenbereich reicht von 2 der Term f r einen Zyklus von zwei Beobachtungen bis zur Anzahl der Beobachtungen der konstante Term oder Mittelwertterm Die Periode wird auf einer logarithmischen Skala dargestellt Zus tzliche Funktionen beim Befehl SPECTRA Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Die berechneten Spektralanalysevariablen k nnen f r eine sp tere Verwendung in der Arbeitsdatei gespeichert werden F r das Spektral Fenster k nnen benutzerdefinierte Gewichtungen festgelegt werden m Es k nnen Diagramme so
68. d eine Tabelle mit modell bergreifend berechneten Anpassungsstatistiken erstellt z B R Quadrat mittlerer absoluter Fehler in Prozent und normalisiertes BIC Diese Tabelle bietet eine pr zise Zusammenfassung daf r wie gut das Modell an die Daten angepasst ist gt Klicken Sie auf die Registerkarte Diagramme 56 Kapitel 6 Abbildung 6 8 Zeitreihenmodellierung Registerkarte Diagramme E Zeitreihenmodellierung Variablen Statistik Diagramme Ausgabefilter Speichern Optionen Diagramme zum Vergleichen von Modellen _ R Quadrat f r station ren Teil R Quadrat C Maximaler absoluter Fehler C wurzel der mittleren Fehler Quadratsumme _ Normalisiertes BIC V Mittlerer absoluter Fehler in Prozent C Residuen Autokorrelationsfunktion ACF C Mittlerer absoluter Fehler C Part Residuen Autokorrelationsfunktion PACF Diagramme nach einzelnen Modellen _ Datenreihen C Residuen Autokorrelationsfunktion ACF Diagrammanzeige Part Residuen Autokorrelationsfunktion PACF gt Deaktivieren Sie im Gruppenfeld Diagramme nach einzelnen Modellen die Option Datenreihen Hierbei werden die Zeitreihen Diagramme f r einzelne Modelle unterdr ckt Das vorliegende Beispiel soll in erster Linie erl utern wie die Vorhersagen in neuen Variablen gespeichert werden Das Erzeugen von Diagrammen der Vorhersagen ist nur von sekund rem Interesse Mit den Optionen im Gruppenfeld Diagramme zum Vergle
69. d geben Sie die Anzahl von Modellen an die eingeschlossen werden sollen Die Auswahl dieser Option hindert Sie nicht daran auch die am schlechtesten angepassten Modelle auszuw hlen Die Ausgabe w rde in diesem Fall sowohl die am schlechtesten als auch die am besten angepassten Modelle enthalten m Feste Anzahl von Modellen Gibt an dass Ergebnisse f r die n am besten angepassten Modelle angezeigt werden Wenn die Anzahl die Anzahl der gesch tzten Modelle berschreitet werden alle Modelle angezeigt m Prozentsatz der Gesamtanzahl von Modellen Gibt an dass Ergebnisse f r Modelle angezeigt werden deren Werte f r die Anpassungsg te f r alle gesch tzten Modelle in den obersten n Prozent liegen 22 Kapitel 2 Am schlechtesten angepa te Modelle Aktivieren Sie diese Option um die am schlechtesten angepassten Modelle in die Ausgabe einzuschlie en W hlen Sie ein Ma f r Anpassungsg te und geben Sie die Anzahl von Modellen an die eingeschlossen werden sollen Die Auswahl dieser Option hindert Sie nicht daran auch die am besten angepassten Modelle auszuw hlen Die Ausgabe w rde in diesem Fall sowohl die am besten als auch die am schlechtesten angepassten Modelle enthalten sm Feste Anzahl von Modellen Gibt an dass Ergebnisse f r die n am schlechtesten angepassten Modelle angezeigt werden Wenn die Anzahl die Anzahl der gesch tzten Modelle berschreitet werden alle Modelle angezeigt m Prozentsatz der Gesamtanzahl
70. daher vom angezeigten Wert abweichen Die tats chliche Sch tzperiode f r ein bestimmtes Modell entspricht der Zeitspanne die verbleibt nachdem die direkt aufeinander folgenden fehlenden Werte von der abh ngigen Variablen des Modells entfernt wurden am Anfang oder am Ende der angegebenen Sch tzperiode Vorhersageperiode Die Vorhersageperiode f r die einzelnen Modelle beginnt immer mit dem ersten Fall nach dem Ende der Sch tzperiode und endet entweder mit dem letzten Fall in der Arbeitsdatei oder an einem vom Benutzer festgelegten Datum Wenn die Parameter nicht erneut gesch tzt werden Standardeinstellung ist die Sch tzperiode f r die einzelnen Modelle die Gruppe von F llen die bei der Entwicklung oder letzten Aktualisierung des jeweiligen Modells verwendet wurden 30 Kapitel 3 m Erster Fall nach der Sch tzperiode bis letzter Fall in der Arbeitsdatei W hlen Sie diese Option aus wenn das Ende der Sch tzperiode vor dem letzten Fall in der Arbeitsdatei liegt und die Vorhersage auch den letzten Fall erfassen soll m Erster Fall nach der Sch tzperiode bis zum angegebenen Datum W hlen Sie diese Option aus um das Ende der Vorhersageperiode explizit festzulegen Geben Sie in alle Zellen des Datengitters Werte ein Wenn f r die Arbeitsdatei kein Datum angegeben wurde wird im Datengitter nur die Spalte Beobachtung angezeigt Um das Ende der Vorhersageperiode festzulegen geben Sie die Zeilennummer des entsprechenden Fal
71. deler Modell Ausreifier Tuer I Additiv M Verschiebung im Niveau Innovativ Transient C Saisonal additiv C Lokaler Trend C Additiver Bereich Auf der Registerkarte Ausrei er k nnen Sie die automatische Erkennung von Ausrei ern und die Typen von Ausrei ern angeben die erkannt werden sollen 10 Kapitel 2 Ausrei er automatisch erkennen In der Standardeinstellung wird keine automatische Erkennung von Ausrei ern durchgef hrt Aktivieren Sie diese Option um eine automatische Erkennung von Ausrei ern durchzuf hren und w hlen Sie anschlie end mindestens einen der folgenden Ausrei ertypen aus Additiv Verschiebung im Niveau Innovativ Transient Saisonal additiv Lokaler Trend Additiver Bereich F r weitere Informationen siehe Ausrei ertypen in Anhang B auf S 103 Exponentielles Gl tten Benutzerdefinierte Modelle Abbildung 2 4 Dialogfeld Kriterien f r exponentielles Gl tten Zeitreihenmodellierung Kriterien f r exponentielles Gl tten Modelltyp Transformation abh ngiger Yariablen Nicht saisonal keine OF O Quadratwurzel O Linearer Trend nach Holt Nat rl Log O Linearer Trend nach Brown Gedampfter Trend Saisonal O Einfach saisonal O winters additiv winters multiplikativ Aktuelle Periodizit t 12 Abbrechen Hilfe Modelltyp Modelle mit exponentiellem Gl tten Gardner 1985 werden als saisonal oder nichtsaisonal klassifiziert Saisona
72. dem eine angenommene Periodizit t der Daten festgelegt beispielsweise eine Periodizit t von 12 wenn das Zeitintervall zwischen aufeinander folgenden F llen einen Monat betr gt Diese Periodizit t ist erforderlich wenn Sie saisonale Modelle erstellen m chten Wenn Sie keine saisonalen Modelle erstellen m chten und keine Datumsbeschriftungen in der Ausgabe ben tigen m ssen Sie das Dialogfeld Datum definieren nicht aufrufen Die den einzelnen F llen zugewiesene Beschriftung enth lt dann einfach die Fallnummer So verwenden Sie die Zeitreihenmodellierung W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Modelle erstellen 6 Kapitel 2 Abbildung 2 1 Zeitreihenmodellierung Registerkarte Variablen E Zeitreihenmodellierung u Variablen Statistik Diagramme Ausgabefilter Speichern Optionen Yariablen Abhangige Yariablen FA i E Subscribers for Market 1 Market_1 E YEAR not periodic YEAR_ E Subscribers for Market 2 Market_2 amp MONTH period 12 MONTH_ Subscribers for Market 3 Market_3 E Subscribers for Market 4 Market _4 E Subscribers for Market 5 Market_5 lt gt Unabh ngige Variablen Methode Expert Modeler v Modelltyp Alle Modelle Sch tzperiode Vorhersageperiode Start Erster Fall Start Erster Fall nach der Sch tzperiode Ende Letzter Fall Ende Letzter Fall in der Arbeitsdatei gt Wahlen Sie auf der
73. den Regeln gelten bei der Modellierungsprozedur f r die Behandlung fehlender Werte Sie gelten auch f r systemdefinierte fehlende Wert und als ung ltig behandelte benutzerdefinierte fehlende Werte m F lle mit fehlenden Werten einer abh ngigen Variablen die innerhalb der Sch tzperiode liegen werden in das Modell eingeschlossen Die genaue Behandlung des fehlenden Werts h ngt von der Sch tzmethode ab m Wenn eine unabh ngige Variable innerhalb der Sch tzperiode fehlende Werte aufweist wird eine Warnung ausgegeben Im Expert Modeler werden Modelle die die unabh ngige Variable enthalten ohne die Variable gesch tzt Bei einer benutzerdefinierten ARIMA werden Modelle die die unabh ngige Variable enthalten nicht gesch tzt m Wenn unabh ngige Variablen innerhalb der Vorhersageperiode fehlende Werte aufweisen gibt die Prozedur eine Warnung aus und f hrt die Vorhersage auf der Grundlage der vorhandenen Werte aus Konfidenzintervallbreite Konfidenzintervalle werden f r die Modellvorhersagen und Residuen Autokorrelationen berechnet Es kann ein beliebiger positiver Wert unter 100 angegeben werden In der Standardeinstellung wird ein Konfidenzintervall von 95 verwendet Pr fix f r Modellbezeichner in Ausgabe Jede auf der Registerkarte Variablen angegebene abh ngige Variable erzeugt ein eigenes gesch tztes Modell Jedes Modell weist einen eindeutigen Namen auf der sich aus einem anpassbarem Pr fix und einem ganzzahli
74. den sollen Der Standardwert ist R Quadrat 37 Zeitreihenmodell zuweisen Speichern von Modellvorhersagen und Modellspezifikationen Abbildung 3 5 Zeitreihenmodell zuweisen Registerkarte Speichern E Zeitreihenmodell zuweisen Modelle Statistik Diagramme Ausgabefilter Speichern Optionen Variablen speichern Variablen Beschreibung Speichern Pr fix f r Variablennamen Vorhergesagte Werte _ _ Vorhersagewert Untere Konfidenzgrenzen F Obere Konfidenzgrenzen F o F r jedes ausgew hlte Element wird je abh ngiger Variablen eine Variable gespeichert Modelldatei mit erneut gesch tzten Parametern exportieren Auf der Registerkarte Speichern k nnen Sie festlegen dass Modellvorhersagen als neue Variablen in der Arbeitsdatei gespeichert werden sollen Au erdem k nnen die Modellspezifikationen in einer externen Datei im XML Format gespeichert werden Variablen speichern Sie k nnen Modellvorhersagen Konfidenzintervalle und Residuen als neue Variablen in der Arbeitsdatei speichern Jedes Modell erzeugt eine eigene Gruppe neuer Variablen Wenn die Vorhersageperiode die L nge der abh ngigen Zeitreihe berschreitet die dem Modell zugewiesen ist werden neue F lle hinzugef gt Sofern die Modellparameter nicht erneut gesch tzt werden Erneut aus den Daten sch tzen auf der Registerkarte Modelle werden die vorhergesagten Werte und Konfidenzgrenzen nur f r die Vorhersageperiode erstell
75. e date Transformieren Nat rlicher Logarithmus C Differenz Saisonale Differenz Aktuelle Periodizit t Keine Einf gen Zur cksetzen Abbrechen Hilfe Saisonale Zerlegung W hlen Sie die Variable Sales of Men 5 Clothing aus und verschieben Sie sie in die Liste Variablen W hlen Sie die Variable Date und verschieben Sie sie in die Liste Zeitachsenbeschriftung Klicken Sie auf OK Abbildung 10 2 Absatz an Herrenbekleidung in US Dollar 40000 00 20000 00 Sales of Men s Clothing 0 00 90 Kapitel 10 gt gt gt Die Zeitreihe weist eine Reihe von Spitzen auf die sich jedoch nicht im gleichen Abstand zueinander zu befinden scheinen Diese Ausgabe deutet darauf hin dass die Zeitreihe eine periodische Komponente aufweist Au erdem weist sie Fluktuationen auf die nicht periodisch sind der typische Fall bei Zeitreihen mit Echtzeit Neben den kleineren Fluktuationen scheinen auch die signifikanten Spitzen weiter auseinanderzuliegen als nur ein paar Monate In Anbetracht der saisonalen Natur des Absatzes der normalerweise in der Weihnachtszeit Spitzenwerte aufweist l sst sich schlie en dass die Zeitreihe wahrscheinlich eine j hrliche Periodizit t aufweist Beachten Sie au erdem dass die saisonalen Variationen im Einklang mit dem Aufw rtstrend der Zeitreihe zunehmen was darauf hindeutet dass die saisonalen Variationen
76. e Bezeichnungen auf der Grundlage der hnlichkeiten zu sortieren Zwei Gruppen eine weibliche und eine m nnliche Gruppe wurden gebeten die Bezeichnungen zweimal zu sortieren die zweite Sortierung sollte dabei nach einem anderen Kriterium erfolgen als die erste So wurden insgesamt sechs Quellen erzielt Jede Quelle entspricht einer hnlichkeitsmatrix mit 15 x 15 Elementen Die Anzahl der Zellen ist dabei gleich der 114 Anhang D Anzahl der Personen in einer Quelle minus der Anzahl der gemeinsamen Platzierungen der Objekte in dieser Quelle kinship_ini sav Diese Datendatei enth lt eine Ausgangskonfiguration f r eine dreidimensionale L sung f r kinship_dat sav kinship_var sav Diese Datendatei enth lt die unabh ngigen Variablen gender Geschlecht gener Generation und degree Verwandtschaftsgrad die zur Interpretation der Dimensionen einer L sung f r kinship_dat sav verwendet werden k nnen Insbesondere k nnen sie verwendet werden um den L sungsraum auf eine lineare Kombination dieser Variablen zu beschr nken mailresponse sav Hierbei handelt es sich um eine hypothetische Datendatei in der es um die Bem hungen eines Bekleidungsherstellers geht der ermitteln m chte ob die Verwendung von Briefsendungen f r das Direktmarketing zu schnelleren Antworten f hrt als Postwurfsendungen Die Mitarbeiter in der Bestellannahme erfassen wie vielen Wochen nach der Postsendung die einzelnen Bestellungen aufgegeben wu
77. e Uk A Amount Spent on Prin 2 amp Amount Spent on Prin Arithmetisch Number of Customer CDF amp CDF nichtzentral L YEAR not periodic VI Datumsarithmetik z e MONTH period 12 M es en Ga Date Format MMM E w a Eurktionen a nd Sondervariablen A E Error from Seasonal Di Date a E Seasonal Adjusted Se CASENUM Aktuelle laufende A Date11 Fallnummer Fur jeden Fall ist 7 KA Seasonal Factors for CASENUM die Anzahl der gelesenen E Trend cycle for Sales F lle einschlie lich des aktuellen Falls Die mit den einzelnen F llen verkn pften Werte ndern sich wenn sich die ae Bienen ir W hlen Sie Fall einschlie en wenn Bedingung erf llt ist aus gt Geben Sie im Textfeld die Zeichenfolge CASENUM gt 120 ein Dadurch werden nderungen an der Variablen mail auf die F lle in der Vorhersageperiode begrenzt Klicken Sie auf Weiter Klicken Sie im Dialogfeld Variable berechnen auf OK und klicken Sie erneut auf OK wenn Sie gefragt werden die Sie die vorhandene Variable ndern m chten Dadurch werden die Werte f r mail also die Anzahl der versendeten Kataloge f r jeden der drei Monate in der Vorhersageperiode um 2000 erh ht Sie haben nun die Daten f r den Test des ersten Szenarios vorbereitet und k nnen die Analyse durchf hren Durchf hrung der Analyse W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Ze
78. e modelliert werden Das Aggregat der Betriebsmonate f r jede Zelle der durch die Kreuzklassifizierung der Faktoren gebildeten Tabelle gibt die Werte f r die Risikoanf lligkeit an site sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Unternehmens geht neue Standorte f r die betriebliche Expansion auszuw hlen Das Unternehmen beauftragte zwei Berater unabh ngig voneinander mit der Bewertung der Standorte Neben einem umfassenden Bericht gaben die Berater auch eine zusammenfassende Wertung f r jeden Standort als good gut fair mittelm ig oder poor schlecht ab 117 Beispieldateien siteratings sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Betatests der neuen Website eines E Commerce Unternehmens geht Jeder Fall entspricht einem Beta Tester der die Brauchbarkeit der Website auf einer Skala von 0 bis 20 bewertete smokers sav Diese Datendatei wurde aus der Umfrage National Household Survey of Drug Abuse aus dem Jahr 1998 abstrahiert und stellt eine Wahrscheinlichkeitsstichprobe US amerikanischer Haushalte dar Daher sollte der erste Schritt bei der Analyse dieser Datendatei darin bestehen die Daten entsprechend den Bev lkerungstrends zu gewichten smoking sav Hierbei handelt es sich um eine von Greenacre Greenacre 1984 vorgestellte hypothetische Tabelle Die relevante Tabelle wird durch eine Kreuztabelle der Rauch
79. e zu erhalten Wenn Sie die Vorhersagen in der Arbeitsdatei speichern k nnen Sie die Ergebnisse problemlos zur ck nach Excel exportieren Statistiken Ma e f r die Anpassungsg te R Quadrat f r station ren Teil R Quadrat R2 Wurzel der mittleren Fehler Quadratsumme RMSE mittlerer absoluter Fehler MAE mittlerer absoluter Fehler in Prozent MAPE maximaler absoluter Fehler MaxAE maximaler absoluter Fehler in Prozent MaxAPE normalisiertes Bayes sches Informationskriterium BIC Residuen Autokorrelationsfunktion partielle Autokorrelationsfunktion Ljung Box O F r ARIMA Modelle ARIMA Ordnungen f r abh ngige Variablen bertragungsfunktion Ordnungen f r unabh ngige Variablen und Ausrei ersch tzer Au erdem Gl ttungsparametersch tzer f r Modelle mit exponentiellem Gl tten Diagramme Diagramme f r alle Modelle Histogramm von R Quadrat f r station ren Teil R Quadrat R2 Wurzel der mittleren Fehler Quadratsumme RMSE mittlerer absoluter Fehler MAE mittlerer absoluter Fehler in Prozent MAPE maximaler absoluter Fehler MaxAE maximaler absoluter Fehler in Prozent MaxAPE normalisiertes Bayes sches Informationskriterium BIC Boxplots der Residuen Autokorrelationen und partiellen Autokorrelationen Ergebnisse f r einzelne Modelle Vorhersagewerte Anpassungswerte beobachtete Werte untere und obere Konfidenzgrenzen Residuen Autokorrelationen und partielle Autokorrelationen 5 Zeitreihenmod
80. eduren Die Prozedur Saisonale Zerlegung dient zur Entfernung einer einzelnen saisonalen Komponente aus einer periodischen Zeitreihe m Um eine tiefer gehende Analyse der Periodizit t einer Zeitreihe durchzuf hren als es mit der partiellen Korrelationsfunktion m glich ist sollten Sie die Prozedur Spektraldiagramme verwenden Weitere Informationen finden Sie unter Kapitel 11 Kapitel Spektraldiagramme Verwendung von Spektraldiagrammen zur berpr fung der Erwartungen hinsichtlich der Periodizit t Zeitreihen die f r Abs tze im Einzelhandel stehen weisen normalerweise eine zugrunde liegende j hrliche Periodizit t auf die auf den blichen Anstieg des Absatzes in der Vorweihnachtszeit zur ckzuf hren ist Wenn Absatzprojektionen erstellt werden sollen muss ein Modell der Zeitreihe konstruiert werden was wiederum bedeutet dass etwaige periodische Komponenten identifiziert werden m ssen Ein Diagramm der Zeitreihe offenbart m glicherweise nicht immer die j hrliche Periodizit t da Zeitreihen Zufallsfluktuationen aufweisen die h ufig die zugrunde liegende Struktur maskieren Die monatlichen Absatzdaten f r ein Versandhaus sind in der Datei catalog sav gespeichert F r weitere Informationen siehe Beispieldateien in Anhang D auf S 108 Bevor Sie mit den Absatzprojektionen fortfahren m chten Sie best tigt wissen dass die Absatzdaten eine j hrliche Periodizit t aufweisen Ein Diagramm der Zeitreihe zeigt vie
81. ei er Unabh ngige Yariablen bertragungsfunktion Ordnungen N struktur Nichtsaisonal Saisonal Zahler 0 0 Nenner 0 0 Differenz 0 0 Aktuelle Periodizit t 12 Verz gerung 0 Transformation Keine Quadratwurzel O Nat rl Log Auf der Registerkarte bertragungsfunktion nur vorhanden wenn unabh ngige Variablen angegeben wurden k nnen Sie bertragungsfunktionen f r bestimmte oder alle unabh ngigen Variablen definieren die auf der Registerkarte Variablen angegeben sind Durch bertragungsfunktionen kann angegeben werden wie zur ckliegende Werte unabh ngiger Variablen Pr diktoren zum Vorhersagen zuk nftiger Werte der abh ngigen Zeitreihe verwendet werden sollen bertragungsfunktion Ordnungen Geben Sie Werte f r die verschiedenen Komponenten der bertragungsfunktion in die entsprechenden Zellen des Strukturgitters ein Alle Werte m ssen nichtnegative Ganzzahlen sein Bei Z hler und Nennerkomponenten stellt der Wert die h chste Ordnung dar Alle positiven niedrigeren Ordnungen werden in das Modell eingeschlossen Dar ber hinaus wird die Ordnung 0 bei Z hlerkomponenten immer eingeschlossen Wenn Sie beispielsweise 2 als Z hler angeben enth lt das Modell die Ordnungen 2 1 und 0 Wenn Sie 3 als Nenner angeben enth lt das Modell die Ordnungen 3 2 und 1 Die Zellen in der Spalte 15 Zeitreihenmodellierung Saisonal sind nur verf gbar wenn f r die Arbeitsd
82. eine Tabelle der Parametersch tzer an F r Modelle mit exponentiellem Gl tten und ARIMA Modelle werden eigene Tabellen angezeigt Wenn Ausrei er vorhanden sind werden Parametersch tzer f r diese ebenfalls in einer eigenen Tabelle angezeigt m Residuen Autokorrelationsfunktion ACF Zeigt f r jedes gesch tzte Modell eine Tabelle der Residuen Autokorrelationen nach Intervall an Die Tabelle enth lt die Konfidenzintervalle f r die Autokorrelationen m Part Residuen Autokorrelationsfunktion PACF Zeigt f r jedes gesch tzte Modell eine Tabelle der partiellen Residuen Autokorrelationen nach Intervall an Die Tabelle enth lt die Konfidenzintervalle f r die partiellen Autokorrelationen 19 Zeitreihenmodellierung Vorhersagen anzeigen Zeigt eine Tabelle der Modellvorhersagen und der Konfidenzintervalle f r jedes gesch tzte Modell an Die Vorhersageperiode wird auf der Registerkarte Optionen festgelegt Diagramme Abbildung 2 9 Zeitreihenmodellierung Registerkarte Diagramme E Zeitreihenmodellierung Variablen Statistik Diagramme Ausgabefilter Speichern Optionen Diagramme zum Vergleichen von Modellen IR Quadrat f r station ren Teil _ R Quadrat C Wurzel der mittleren Fehler Quadratsumme V Mittlerer absoluter Fehler in Prozent C Mittlerer absoluter Fehler Diagramme nach einzelnen Modellen C Datenreihen Diagrammanzeige C Maximaler absoluter Fehler C Normalisiertes B
83. eld zur ck Garantie Die Verpackungsgestaltung liegt in drei Faktorstufen vor die sich durch die Position der Auftrageb rste unterscheiden Au erdem gibt es drei Markennamen K2R Glory und Bissell drei Preisstufen sowie je zwei Stufen Nein oder Ja f r die letzten beiden Faktoren 10 Kunden stufen 22 Profile ein die durch diese Faktoren definiert sind Die Variable Preference enth lt den Rang der durchschnittlichen Einstufung f r die verschiedenen Profile Ein niedriger Rang bedeutet eine starke Bevorzugung Diese Variable gibt ein Gesamtma der Bevorzugung f r die Profile an carpet_prefs sav Diese Datendatei beruht auf denselben Beispielen wie f r carpet sav beschrieben enth lt jedoch die tats chlichen Einstufungen durch jeden der 10 Kunden Die Kunden wurden gebeten die 22 Produktprofile in der Reihenfolge ihrer Pr ferenzen einzustufen Die Variablen PREF bis PREF22 enthalten die IDs der zugeordneten Profile wie in carpet_plan sav definiert catalog sav Diese Datendatei enth lt hypothetische monatliche Verkaufszahlen f r drei Produkte die von einem Versandhaus verkauft werden Daten f r f nf m gliche Einflussvariablen wurden ebenfalls aufgenommen catalog_seasfac sav Diese Datendatei ist mit catalog sav identisch au er dass ein Set von saisonalen Faktoren die mithilfe der Prozedur Saisonale Zerlegung berechnet wurden sowie die zugeh rigen Datumsvariablen hinzugef gt wurden cellular sav Hierbei handelt
84. eler Abbildung 8 5 Zeitreihenmodellierung Registerkarte Speichern E Zeitreihenmodellierung Variablen Statistik Diagramme Ausgabefilter Speichern Optionen Variablen speichern Variablen Beschreibung Speichern Pr fix f r Variablennamen Vorhergesagte Werte Untere Konfidenzgrenzen Obere Konfidenzgrenzen Residuum Rauschen F r jedes ausgew hlte Element wird je abh ngiger Yariablen eine Variable gespeichert Modelldatei exportieren Das gesch tzte Modell sollte in einer externen XML Datei gespeichert werden sodass Sie in der Prozedur Zeitreihenmodell zuweisen mit verschiedene Werte f r die Einflussvariablen experimentieren k nnen ohne das Modell erneut erstellen zu m ssen Klicken Sie auf der Registerkarte Speichern auf die Schaltfl che Durchsuchen Dadurch wird ein Standarddialogfeld zum Speichern von Dateien ge ffnet gt Wechseln Sie in den Ordner in dem Sie die XML Modelldatei speichern m chten Geben Sie einen Dateinamen ein und klicken Sie auf Speichern Der Pfad f r die XML Modelldatei wird daraufhin auf der Registerkarte Speichern angezeigt gt Klicken Sie auf die Registerkarte Statistik 72 Kapitel 8 Abbildung 8 6 Zeitreihenmodellierung Registerkarte Statistik E Zeitreihenmodellierung Variablen Statistik Diagramme Ausgabefilter Speichern Optionen M AnpassungsmaBe Liung Box Statistik und Anzahl von Ausrei ern nach Mode
85. elle Periodizit t 12 C Ein Diagramm je Variable Einf gen Zur cksetzen Abbrechen Hilfe W hlen Sie die Variable Total Number of Subscribers aus und verschieben Sie sie in die Liste Variablen W hlen Sie die Variable Date aus und verschieben Sie sie in das Feld Zeitachsenbeschriftung Klicken Sie auf OK Abbildung 6 2 Gesamtzahl der Vertragskunden f r Breitbandnutzung auf allen M rkten 2400000 2100000 1800000 1500000 1200000 Total Number of Subscribers 900000 600000 ozs Br5 eB lt 3 ogre ook B lt 5 oBz2s oBxs o lt oBre ook ed lt d Bzs 8af BE Bre BoR 8 lt nBzs nga nB lt 3 ngra ngok nB lt ozs wBne vg o8re ugok oB lt s Datum 51 Prognosen f r gro e Datenmengen mit dem Expert Modeler Die Zeitreihe zeigt einen sehr gleichm igen Aufw rtstrend ohne Anzeichen f r saisonale Variationen M glicherweise weisen einzelne Zeitreihen Saisonalit t auf jedoch scheint die Saisonalit t im Allgemeinen kein ausgepr gtes Merkmal der Daten zu sein Selbstverst ndlich m ssen Sie jede der Zeitreihen untersuchen bevor Sie saisonale Modelle ausschlie en Sie k nnen dann die Zeitreihen aussondern die Saisonalit t aufweisen und diese separat modellieren Im vorliegenden Fall zeigt die Untersuchung der 85 Zeitreihen dass kein Markt Saisonalit t aufweist Durchf hrung der Analyse So verwenden Sie den Expert Modeler
86. ellierung Erl uterungen der Daten f r die Prozedur Zeitreihenmodellierung Daten Die abh ngige Variable und etwaige unabh ngige Variablen m ssen numerisch sein Annahmen Die abh ngige Variable und alle unabh ngigen Variablen werden als Zeitreihen behandelt d h jeder Fall repr sentiert einen Zeitpunkt und die nachfolgenden F lle liegen jeweils ein konstantes Zeitintervall auseinander m Stationarit t Bei benutzerdefinierten ARIMA Modellen muss die zu modellierende Zeitreihe station r sein Die effektivste Methode zur Transformation einer nichtstation ren Zeitreihe in eine station re besteht in einer Differenztransformation aufzurufen ber das Dialogfeld Zeitreihe erstellen m Vorhersagen Wenn Vorhersagen anhand von Modellen mit unabh ngigen Variablen Einflussvariablen Pr diktoren erstellt werden sollen muss die Arbeitsdatei f r alle F lle innerhalb der Vorhersageperiode Werte dieser Variablen enthalten Dar ber hinaus d rfen die unabh ngigen Variablen in der Sch tzperiode keine fehlenden Werte enthalten Datum definieren Es ist zwar nicht zwingend erforderlich aber es empfiehlt sich im Dialogfeld Datum definieren das dem ersten Fall zugewiesene Datum und die Intervalle zwischen den nachfolgenden F llen anzugeben Diese Angabe erfolgt vor der Verwendung der Zeitreihenmodellierung und ergibt eine Gruppe von Variablen die das den einzelnen F llen zugewiesene Datum bezeichnen Dabei wird au er
87. elt automatisch das jeweils am besten angepasste saisonale oder nichtsaisonale Modell f r jede der abh ngigen Zeitreihen Klicken Sie auf Kriterien und klicken Sie dann auf die Registerkarte Ausrei er 70 Kapitel 8 Abbildung 8 4 Dialogfeld Kriterien f r Expert Modeler Registerkarte Ausreier Zeitreihenmodellierung Kriterien f r Expert Modeler Modell Ausrei ier Zu erkennende Typen von Ausrei ern I Additiv M Verschiebung im Niveau Innovativ Cl Transient C Saisonal additiv Lokaler Trend C Additiver Bereich Wahlen Sie Ausrei er automatisch erkennen und behalten Sie die Standardauswahl fiir die zu erkennenden Ausrei ertypen unver ndert bei Bei der visuellen Untersuchung der Daten stellte sich heraus dass m glicherweise Ausrei er vorliegen Mit der aktuellen Auswahl sucht der Expert Modeler nach den h ufigsten Ausrei ertypen und integriert etwaige Ausrei er in das endg ltige Modell Die Ausrei ererkennung kann zu betr chtlichen Erh hungen der erforderlichen Rechenzeit f r den Expert Modeler f hren Daher sollte diese Funktion mit Bedacht verwendet werden insbesondere wenn Sie viele Datenreihen gleichzeitig modellieren In der Standardeinstellung werden Ausrei er nicht erkannt Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Zeitreihenmodellierung auf die Registerkarte Speichern 71 Ermitteln von signifikanten Einflussvariablen mit dem Expert Mod
88. em Gl tten m Nur ARIMA Modelle Der Expert Modeler ber cksichtigt nur ARIMA Modelle 9 Zeitreihenmodellierung Expert Modeler ber cksichtigt saisonale Modelle Diese Option ist nur verf gbar wenn f r die Arbeitsdatei eine Periodizit t definiert wurde Wenn diese Option aktiviert wird ber cksichtigt der Expert Modeler sowohl saisonale als auch nichtsaisonale Modelle Wenn diese Option deaktiviert ist ber cksichtigt der Expert Modeler nur nichtsaisonale Modelle Aktuelle Periodizit t Gibt die gegenw rtig f r die Arbeitsdatei definierte Periodizit t an sofern vorhanden Die aktuelle Periodizit t wird als Ganzzahl angegeben z B 12 f r eine j hrliche Periodizit t wobei jeder Fall einen Monat darstellt Wenn keine Periodizit t angegeben wurde wird der Wert Keine angezeigt F r saisonales Modelle muss eine Periodizit t angegeben werden Die Periodizit t wird im Dialogfeld Datum definieren angegeben Ereignisse W hlen Sie unabh ngige Variablen aus die als Ereignisvariablen behandelt werden sollen Bei Ereignisvariablen geben F lle mit einem Wert von 1 die Zeitpunkte an zu denen erwartet wird dass die abh ngigen Zeitreihen von dem Ereignis beeinflusst werden Andere Werte als 1 geben an dass sie nicht beeinflusst werden Behandeln von Ausrei ern mit dem Expert Modeler Abbildung 2 3 Dialogfeld Kriterien fur Expert Modeler Registerkarte Ausrei er Zeitreihenmodellierung Kriterien f r Expert Mo
89. en 31 33 64 in Zeitreihenmodellierung 17 19 56 Mittlerer absoluter Fehler 101 in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 Mittlerer absoluter Fehler in Prozent 101 in Zeitreihenmodell zuweisen 31 33 64 in Zeitreihenmodellierung 17 19 56 Modell mit exponentiellem Gl tten nach Brown 10 Modell mit exponentiellem Gl tten nach Holt 10 Modell mit exponentiellem Gl tten nach Winters additiv 10 multiplikativ 10 Modellbeschreibung Tabelle in Zeitreihenmodellierung 74 Modelle ARIMA 7 13 Expert Modeler 7 exponentielles Gl tten 7 10 Modelle mit exponentiellem Gl tten 7 10 Modellnamen in Zeitreihenmodellierung 24 Modellparameter in Zeitreihenmodell zuweisen 31 in Zeitreihenmodellierung 17 72 Modellparameter erneut sch tzen in Zeitreihenmodell zuweisen 29 61 Modellstatistik Tabelle in Zeitreihenmodellierung 75 Normalisiertes BIC Bayes Informationskriterium 101 in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 PACF Diagramme f r reine ARIMA Prozesse 104 in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 Partielle Autokorrelationsfunktion Diagramme f r reine ARIMA Prozesse 104 in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 Periodizit t in Zeitreihenmodellierung 8 10 12 14 Pr ff lle 2 Quadratwurzeltransformation in Zeitreihenmodellierung 10 12 14 R2 101 in Zeitreihenmodell zuweisen
90. ennummer wenn Sie sich an SPSS wenden um Informationen ber Kundendienst zu Zahlungen oder Aktualisierungen des Systems zu erhalten Die Seriennummer wird mit dem Base System ausgeliefert Kundendienst Wenden Sie sich mit Fragen bez glich der Lieferung oder Ihres Kundenkontos an Ihr regionales SPSS B ro das Sie auf der SPSS Website unter http www spss com worldwide finden Halten Sie bitte stets Ihre Seriennummer bereit Ausbildungsseminare SPSS bietet ffentliche und unternehmensinterne Seminare an Alle Seminare beinhalten auch praktische bungen Seminare finden in gr eren St dten regelm ig statt Wenn Sie weitere Informationen zu diesen Schulungen w nschen wenden Sie sich an Ihr regionales SPSS B ro das Sie auf der SPSS Website unter http www spss com worldwide finden Technischer Support Kunden von SPSS mit Wartungsvertrag k nnen den Technischen Support in Anspruch nehmen Kunden k nnen sich an den Technischen Support wenden wenn sie Hilfe bei der Arbeit mit SPSS oder bei der Installation in einer der unterst tzten Hardware Umgebungen ben tigen Informationen ber den Technischen Support finden Sie auf der Website von SPSS unter http www spss com oder wenden Sie sich an Ihr regionales SPSS B ro das Sie auf der SPSS Website unter http www spss com worldwide finden Bei einem Anruf werden Sie nach Ihrem Namen dem Namen Ihrer Organisation und Ihrer Seriennummer gefragt Weitere Ver ffentlichungen Wei
91. er Ausdruck mail mail 2000 Typ amp Label amp Date date A E Sales of Men s Clo 2 Sales of Women s L Sales of Jewelry je E Number of Catalog 2 Number of Pages i E Number of Phone Amount Spent on f j 2 Number of Custom Funktionen und Sonderyariablen YEAR not periodic b MONTH period 12 daDate Format M E Error from Season E Seasonal Adjusted Seasonal Factors f L Trend cycle for Sa Funktionsguppe E Aktuelles Datum aktuelle UF a Alle rithmetisc OOo Ae ck EB CDF amp CDF fnichtzentrall Datumsarithmetik Datumserstellung J Datumsextraktion Erstellung der Zeitdauer v Foto nl tine Soe Fete QHO0H Falls optionale Fallauswahlbedingung Geben Sie mail als Zielvariable ein gt Geben Sie im Textfeld Numerischer Ausdruck die Zeichenfolge mail 2000 ein Klicken Sie auf Falls 83 Untersuchen von Einflussvariablen durch das Zuweisen gespeicherter Modelle Abbildung 9 7 Dialogfeld Variable berechnen Falls Bedingung erf llt ist Variable berechnen Falls Bedingung erf llt ist Date date O Alle F lle einschlie en E Sales of Men s Clothin Fall einschlie en wenn Bedingung erf llt ist L Sales of Women s Clol CASENUM gt 120 E Sales of Jewelry jewe LJ E Number of Catalogs M L E Number of Pages in C Funktionsguppe E Number of Phone Line Aktuelles Datum aktuell
92. er Vorhersagen als neue Variablen in der Arbeitsdatei oder Erstellen einer Vorhersagetabelle Bei beiden Ans tzen verf gen Sie ber eine Vielzahl von Optionen zum Exportieren der Vorhersagen z B nach Excel Zusammenfassung Sie haben die Verwendung von Expert Modeler kennen gelernt um damit Vorhersagen f r mehrere Zeitreihen zu erstellen und Sie haben die resultierenden Modelle in einer externe XML Datei gespeichert Im n chsten Beispiel werden Sie erfahren wie Sie mithilfe der Prozedur Zeitreihenmodell zuweisen Vorhersagen bei der Verf gbarkeit neuer Daten ausweiten k nnen ohne dass Sie die Modelle erneut erstellen m ssen Kapitel 7 Neuprognosen f r gro e Datenmengen durch das Zuweisen gespeicherter Modelle Sie haben mit der Zeitreihenmodellierung Modelle f r Zeitreihendaten erstellt und erste Vorhersagen auf der Grundlage verf gbarer Daten erzeugt Sie m chten diese Modelle f r eine Erweiterung der Vorhersagen verwenden wenn aktuellere Daten verf gbar werden daher haben Sie die Modelle in einer externen Datei gespeichert Nun k nnen Sie die gespeicherten Modelle zuweisen Dieses Beispiel ist eine Erweiterung des vorhergehenden Beispiels Prognosen f r gro e Datenmengen mit dem Expert Modeler in Kapitel 6 auf S 49 kann jedoch auch unabh ngig verwendet werden In diesem Szenario sind Sie Analytiker f r einen nationalen Breitband Provider und m ssen monatliche Vorhersagen der Vertragskunden in 85 reg
93. ffee sav Diese Datendatei enth lt Daten zum wahrgenommenen Image von sechs Eiskaffeemarken Kennedy Riquier als auch Sharp 1996 Bei den 23 Attributen des Eiskaffee Image sollten die Teilnehmer jeweils alle Marken ausw hlen die durch dieses Attribut beschrieben werden Die sechs Marken werden als AA BB CC DD EE und FF bezeichnet um Vertraulichkeit zu gew hrleisten contacts sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Kontaktlisten einer Gruppe von Vertretern geht die Computer an Unternehmen verkaufen Die einzelnen Kontaktpersonen werden anhand der Abteilung in der sie in ihrem Unternehmen arbeiten und anhand ihrer Stellung in der Unternehmenshierarchie in Kategorien eingeteilt Au erdem werden der Betrag des letzten Verkaufs die Zeit seit dem letzten Verkauf und die Gr e des Unternehmens in dem die Kontaktperson arbeitet aufgezeichnet creditpromo sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Kaufhauses geht die Wirksamkeit einer k rzlich durchgef hrten Kreditkarten Werbeaktion einzusch tzen Dazu wurden 500 Karteninhaber nach dem Zufallsprinzip ausgew hlt Die H lfte erhielt eine Werbebeilage die einen reduzierten Zinssatz f r Eink ufe in den n chsten drei Monaten ank ndigte Die andere H lfte erhielt eine Standard Werbebeilage customer_dbase sav Hierbei handelt es sich um eine hypothetische
94. g Sie haben gelernt wie gespeicherte Modelle zugewiesen werden um fr here Vorhersagen bei der Verf gbarkeit von neuen Daten zu erweitern Dies haben Sie ohne erneutes Erstellen der Modelle erledigt Wenn ein Grund zur Annahme besteht dass ein Modell sich ge ndert hat sollten Sie es selbstverst ndlich mit der Prozedur Zeitreihenmodellierung neu erstellen Kapitel Ermitteln von signifikanten Einflussvariablen mit dem Expert Modeler Eine Katalogfirma die an der Entwicklung eines Prognosemodells interessiert ist hat Daten zum monatlichen Absatz von Herrenbekleidung sowie mehrere Zeitreihen gesammelt die verwendet werden k nnen um einen Teil der Absatzschwankungen zu erkl ren Zu den m glichen Einflussvariablen geh ren die Anzahl der versendeten Kataloge die Anzahl der Seiten im Katalog die Anzahl der Telefonleitungen ber die eine Bestellung m glich ist die Ausgaben f r Werbung in Printmedien und die Anzahl der Kundendienstmitarbeiter Sind diese Einflussvariablen sinnvoll f r die Prognostizierung In diesem Beispiel ermitteln Sie mit dem Expert Modeler in Verbindung mit allen potenziellen Einflussvariablen das beste Modell Da der Expert Modeler nur die Einflussvariablen ausw hlt die eine statistisch signifikante Beziehung zu den abh ngigen Datenreihen aufweisen erfahren Sie so welche Einflussvariablen n tzlich sind und erhalten ein diesbez gliches Modell f r Vorhersagen Wenn Sie fertig sind empfiehlt es s
95. gen Suffix zusammensetzt Sie k nnen ein Pr fix eingeben oder das vorgegebene Pr fix unter Model bernehmen In ACF und PACF Ausgabe angezeigte maximale Anzahl von Intervallen Sie k nnen die H chstanzahl von Intervallen festlegen die in Tabellen und Diagrammen f r Autokorrelationen und partielle Autokorrelationen angezeigt werden 26 Kapitel 2 Zus tzliche Funktionen beim Befehl TSMODEL Sie k nnen die Zeitreihenmodellierung an Ihre Bed rfnisse anpassen indem Sie ihre Auswahl in ein Syntax Fenster einf gen und die resultierende Befehlssyntax f r den Befehl TSMODEL bearbeiten Mit der Befehlssyntax Sprache verf gen Sie ber folgende M glichkeiten m Angeben der saisonalen Periode f r die Daten mit dem Schl sselwort SEASONLENGTH im Unterbefehl AUXILTARY Dadurch wird die aktuelle Periodizit t sofern vorhanden berschrieben die bis dahin in der Arbeitsdatei g ltig war m Angeben von nicht aufeinander folgenden Intervallen f r Komponenten der benutzerdefinierten ARIMA und der bertragungsfunktion mit den Unterbefehlen ARIMA und TRANSFERFUNCTION Sie k nnen beispielsweise ein benutzerdefiniertes ARIMA Modell mit autoregressiven Intervallen der Ordnungen 1 3 und 6 oder eine bertragungsfunktion mit Z hlerintervallen der Ordnungen 2 5 und 8 angeben m Angeben mehrerer Gruppen von Modellierungsspezifikationen z B Modellierungsmethode ARIMA Ordnungen unabh ngige Variablen usw f r eine Ausf hrung der P
96. gewohnheiten und der Berufskategorie gebildet Die Variable Berufsgruppe enth lt die Berufskategorien Senior Manager Junior Manager Angestellter mit Erfahrung Angestellter ohne Erfahrung und Sekretariat sowie die Kategorie National Average die als Erg nzung der Analyse dienen kann Die Variable Rauchen enth lt die Rauchgewohnheiten Nichtraucher Leicht Mittel und Stark sowie die Kategorien No Alcohol und Alcohol die als Erg nzung der Analyse dienen k nnen storebrand sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Verkaufsleiterin in einem Lebensmittelmarkt geht die die Verkaufszahlen des Waschmittels der Eigenmarke gegen ber den anderen Marken steigern m chte Sie erarbeitet eine Werbeaktion im Gesch ft und spricht an der Kasse mit Kunden Jeder Fall entspricht einem Kunden stores sav Diese Datendatei enth lt hypothetische monatliche Marktanteilsdaten f r zwei konkurrierende Lebensmittelgesch fte Jeder Fall entspricht den Marktanteilsdaten f r einen bestimmten Monat stroke_clean sav Diese hypothetische Datendatei enth lt den Zustand einer medizinischen Datenbank nachdem diese mithilfe der Prozeduren in der Option Data Preparation bereinigt wurde stroke_invalid sav Diese hypothetische Datendatei enth lt den urspr nglichen Zustand einer medizinischen Datenbank der mehrere Dateneingabefehler aufweist stroke_survival In dieser hypothetischen Datendatei geht es u
97. gorical data in market research Journal of Targeting Measurement and Analysis for Marketing 5 56 70 McCullagh P als auch J A Nelder 1989 Generalized Linear Models 2nd Hg London Chapman amp Hall Menec V N Roos D Nowicki L MacWilliam G Finlayson als auch C Black 1999 Seasonal Patterns of Winnipeg Hospital Use Manitoba Centre for Health Policy Pena D G C Tiao als auch R S Tsay Hgg 2001 A course in time series analysis New York John Wiley and Sons Price R H als auch D L Bouffard 1974 Behavioral appropriateness and situational constraints as dimensions of social behavior Journal of Personality and Social Psychology 30 579 586 Rickman R N Mitchell J Dingman als auch J E Dalen 1974 Changes in serum cholesterol during the Stillman Diet Journal of the American Medical Association 228 54 58 Rosenberg S als auch M P Kim 1975 The method of sorting as a data gathering procedure in multivariate research Multivariate Behavioral Research 10 489 502 120 121 Bibliografie Van der Ham T J J Meulman D C Van Strien als auch H Van Engeland 1997 Empirically based subgrouping of eating disorders in adolescents A longitudinal perspective British Journal of Psychiatry 170 363 368 Verdegaal R 1985 Meer sets analyse voor kwalitatieve gegevens in niederl ndischer Sprache Leiden Department of Data Theory Universit t Leiden Ware J H
98. gung Speichern Abbildung 4 2 Dialogfeld Saisonale Zerlegung Speichern Saisonale Zerlegung Speichern O Nicht erstellen Variablen erstellen Hier k nnen Sie ausw hlen wie neue Variablen behandelt werden sollen Zur Datei hinzuf gen Die neuen Zeitreihen die durch die saisonale Zerlegung erstellt wurden werden als regul re Variablen in der Arbeitsdatei gespeichert Variablennamen werden aus einem aus drei Buchstaben bestehenden Pr fix einem Unterstrich und einer Zahl gebildet m Vorhandene ersetzen Die neuen Zeitreihen die durch die saisonale Zerlegung erstellt wurden werden als tempor re Variablen in der Arbeitsdatei gespeichert Gleichzeitig werden alle eventuell vorhandenen tempor ren Variablen entfernt die durch Befehle des Moduls Trends erzeugt wurden Variablennamen werden aus einem aus drei Buchstaben bestehenden Pr fix einer Raute und einer Zahl gebildet m Nicht erstellen Die neuen Zeitreihen werden nicht zur Arbeitsdatei hinzugef gt Benennung der neuen Variablen Die Prozedur Saisonale Zerlegung erstellt vier neue Variablen Zeitreihen mit den folgenden dreibuchstabigen Pr fixen f r die einzelnen Reihen SAF Faktoren f r die Saisonbereinigung engl Seasonal Adjustment Factors Diese Werte geben die Auswirkung der einzelnen Perioden auf das Niveau der Zeitreihe an SAS Saisonbereinigte Zeitreihe engl Seasonally Adjusted Series Dies sind die Werte die sich nach dem Entferne
99. gungsbeh rde geht einen Einblick in die R ckfallraten in ihrem Zust ndigkeitsbereich zu gewinnen Jeder Fall entspricht einem fr hren Straft ter und erfasst Daten zu dessen demografischen Hintergrund einige Details zu seinem ersten Verbrechen sowie die Zeit bis zu seiner zweiten Festnahme sofern diese innerhalb von zwei Jahren nach der ersten Festnahme erfolgte recidivism_cs_sample sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Strafverfolgungsbeh rde geht einen Einblick in die R ckfallraten in ihrem Zust ndigkeitsbereich zu gewinnen Jeder Fall entspricht einem fr heren Straft ter der im Juni 2003 erstmals aus der Haft entlassen wurde und erfasst Daten zu dessen demografischen Hintergrund einige Details zu seinem ersten Verbrechen sowie die Daten zu seiner zweiten Festnahme sofern diese bis Ende Juni 2006 erfolgte Die Straft ter wurden aus per Stichprobenziehung ermittelten Polizeidirektionen ausgew hlt gem dem in recidivism_cs csplan angegebenen Stichprobenplan Da hierbei eine PPS Methode PPS probability proportional to size Wahrscheinlichkeit proportional zur Gr e verwendet wird gibt es au erdem eine Datei mit den gemeinsamen Auswahlwahrscheinlichkeiten recidivism_cs_jointprob sav salesperformance sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Bewertung von zwei neuen Verkaufsschulungen geht 60 Mitarbeiter die in drei Gruppen u
100. hen beginnen mit folgenden Pr fixen SAF Faktoren f r die Saisonbereinigung die f r die saisonale Variation stehen Beim multiplikativen Modell steht der Wert f r die Abwesenheit von saisonaler Variation beim additiven Modell steht der Wert 0 f r die Abwesenheit von saisonaler Variation SAS Saisonbereinigte Zeitreihe die f r die urspr ngliche Zeitreihe nach der Entfernung der saisonalen Variationen steht Wenn mit einer saisonbereinigten Zeitreihe gearbeitet wird kann beispielsweise eine Trend Komponente isoliert und unabh ngig von etwaigen saisonalen Komponenten analysiert werden STC Gegl ttete Trend Zyklus Komponente eine gegl ttete Version der saisonbereinigten Zeitreihe die sowohl Trend Komponenten als auch zyklische Komponenten aufweist ERR Die Residuum Komponente der Zeitreihe f r eine bestimmte Beobachtung 94 Kapitel 10 Beim vorliegenden Fall ist die saisonbereinigte Zeitreihe am besten geeignet da sie f r die urspr ngliche Zeitreihe nach Entfernung der saisonalen Variationen steht Abbildung 10 8 Dialogfeld Sequenzdiagramme E Sequenzdiagramme dete E men L women E jewel E mail L page E phone L print E service A vear_ i MonTH_ da DATEL GP ERRI 9 SAFA I s c a Ein Diagramm je Variable variablen L SAS Zeitachsenbeschriftung e Transformieren Nat rlicher Logarithmus Differenz C Saisonale Differenz
101. hen periodischen Komponente einer Zeitreihe best tigt und verifiziert dass keine anderen signifikanten Periodizit ten vorliegen Die Spektraldichte hat sich bei der Offenlegung der zugrunde liegenden Struktur als n tzlicher als das Periodogramm erwiesen da die Spektraldichte die von der nichtperiodischen Komponente der Daten verursachten Fluktuationen gl ttet Verwandte Prozeduren Die Prozedur Spektraldiagramme kann zur Identifizierung der periodischen Komponenten einer Zeitreihen verwendet werden m Um eine periodische Komponente aus einer Zeitreihe zu entfernen beispielsweise um eine Trendanalyse durchzuf hren k nnen Sie die Prozedur Saisonale Zerlegung verwenden Unter Kapitel 10 finden Sie weitere Einzelheiten Anhang A Ma e f r die Anpassungsg te In diesem Abschnitt finden Sie Definitionen der Ma e f r die Anpassungsg te die bei der Zeitreihenmodellierung verwendet werden R Quadrat f r station ren Teil Ein Ma das den station ren Teil des Modells mit einem einfachen Mittelwert Modell vergleicht Dieses Ma ist dem gew hnlichen R Quadrat vorzuziehen wenn ein Trend oder ein saisonales Muster vorliegt R Quadrat f r den station ren Teil kann auch negativ sein es nimmt Werte zwischen minus unendlich und 1 an Negative Werte bedeuten dass das betrachtete Modell schlechter ist als das Basismodell Positive Werte bedeuten dass das betrachtete Modell besser ist als das Basismodell R Qu
102. hetische Datendatei bei der es um die Bem hungen eines Einzelh ndlers geht die Beziehungen zwischen den in Werbung investierten Betr gen und den daraus resultierenden Ums tzen zu untersuchen Zu diesem Zweck hat er die Ums tze vergangener Jahre und die zugeh rigen Werbeausgaben zusammengestellt aflatoxin sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Tests von Maisernten auf Aflatoxin geht ein Gift dessen Konzentration stark zwischen und innerhalb von Ernteertr gen schwankt Ein Kornverarbeitungsbetrieb hat aus 8 Ernteertr gen je 16 Proben erhalten und das Aflatoxinniveau in Teilen pro Milliarde parts per billion PPB gemessen aflatoxin20 sav Diese Datendatei enth lt die Aflatoxinmessungen aus jeder der 16 Stichproben aus den Ertr gen 4 und 8 der Datendatei aflatoxin sav anorectic sav Bei der Ausarbeitung einer standardisierten Symptomatologie anorektischen bulimischen Verhaltens f hrten Forscher Van der Ham Meulman Van Strien als auch Van Engeland 1997 eine Studie mit 55 Jugendlichen mit bekannten Ess St rungen durch Jeder Patient wurde vier Mal ber einen Zeitraum von vier Jahren untersucht es fanden also insgesamt 220 Beobachtungen statt Bei jeder Beobachtung erhielten die Patienten Scores f r jedes von 16 Symptomen Die Symptomwerte fehlen f r Patient 71 108 109 Beispieldateien zum Zeitpunkt 2 Patient 76 zum Zeitpunkt 2 und Patient 47 zum Zeitpunkt 3 wodurch 217 g lt
103. ich m glicherweise das n chste Beispiel Untersuchen von Einflussvariablen durch das Zuweisen gespeicherter Modelle in Kapitel 9 auf S 77 durchzuarbeiten in dem die Auswirkungen verschiedener Szenarien mit Einflussvariablen auf Verk ufe mithilfe des in diesem Beispiel erstellten Modells untersucht werden Die Daten f r das aktuelle Beispiel befinden sich in catalog_seasfac sav F r weitere Informationen siehe Beispieldateien in Anhang D auf S 108 Erstellen von Diagrammen aus den Daten Besonders bei der Arbeit mit nur einer Datenreihe sollten Sie die Daten immer grafisch darstellen W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Sequenzdiagramme 66 67 Ermitteln von signifikanten Einflussvariablen mit dem Expert Modeler Abbildung 8 1 Dialogfeld Sequenzdiagramme Sequenzdiagramme a Be 2 Date date Sales of Men s Clothing men 8E Sales of Women s Clothing wo v E Sales of Jewelry jewel L Number of Catalogs Mailed mail L Number of Pages in Catalog pa Zeitachsenbeschriftung E Number of Phone Lines Open fo e E Amount Spent on Print Advertisi 4 Number of Customer Service Re Transformieren amp YEAR not periodic YEAR_ amp MONTH period 12 MONTH_ E Error from Seasonal Decomposi D Differenz 8 Seasonal Adjusted Series for S 5 2 Seasonal Factors for Sales of O Saisonale Differenz E Trend cycle for Sales of Men s
104. ichen von Modellen k nnen verschiedene Diagramme in Form von Histogrammen von modell bergreifend berechneten Anpassungsstatistiken erstellt werden W hlen Sie im Gruppenfeld Diagramme zum Vergleichen von Modellen die Optionen Mittlerer absoluter Fehler in Prozent und Maximaler absoluter Fehler in Prozent aus Der absolute Fehler in Prozent ist ein Ma daf r wie sehr eine abh ngige Zeitreihe vom Niveau abweicht das vom Modell vorhergesagt wurde Wenn Sie den mittleren und maximalen Prozentsatz modell bergreifend untersuchen erhalten Sie einen Hinweis auf die Unsicherheit in Ihren Vorhersagen Es empfiehlt sich au erdem Auswertungsdiagramme der prozentualen statt der absoluten Fehler heranzuziehen da die abh ngigen Zeitreihen die Anzahl der Vertragskunden f r M rkte mit unterschiedlichen Gr en darstellen gt Klicken Sie im Dialogfeld Zeitreihenmodellierung auf OK 57 Prognosen f r gro e Datenmengen mit dem Expert Modeler Diagramme f r die Modellzusammenfassung Abbildung 6 9 Histogramm des mittleren absoluten Fehlers in Prozent 12 5 10 0 75 H ufigkeit 5 0 2 5 0 0 0 6 0 7 0 8 0 9 1 0 1 1 MAPE Dieses Histogramm zeigt den modell bergreifenden mittleren absoluten Fehler in Prozent MAPE an Es zeigt dass alle Modelle eine mittlere Unsicherheit von ungef hr 1 aufweisen 58 Kapitel 6 Abbildung 6 10 Histogramm des maximalen absoluten Fehlers in Prozent 30
105. ieren Zeitreihen Modelle erstellen 69 Ermitteln von signifikanten Einflussvariablen mit dem Expert Modeler Abbildung 8 3 Dialogfeld Zeitreihenmodellierung E Zeitreihenmodellierung EE Variablen Statistik Diagramme Ausgabefilter Speichern Optionen _ variablen f Abh ngige Variablen Date date E Sales of Men s Clothing men E Sales of Women s Clothing women E Sales of Jewelry jewel YEAR not periodic YEAR MONTH period 12 MONTH E Error from Seasonal Decomposition S E Seasonal Adjusted Series for Sales of Seasonal Factors for Sales of Men s Cl E Trend cycle for Sales of Men s Clothin Unabh ngige Yariablen amp Number of Catalogs Mailed mail 8E Number of Pages in Catalog page E Number of Phone Lines Open for Orde E Amount Spent on Print Advertising pri 8E Number of Customer Service Represe Methode Expert Modeler v Modelltyp Alle Modelle Sch tzperiode Vorhersageperiode Start Erster Fall Start Erster Fall nach der Sch tzperiode Ende Letzter Fall Ende Letzter Fall in der Arbeitsdatei gt Wahlen Sie Sales of Men s Clothing als abh ngige Variable aus W hlen Sie die Variablen Number of Catalogs Mailed bis Number of Customer Service Representatives als unabh ngige Variablen aus gt Stellen Sie sicher dass in der Dropdown Liste Methode die Option Expert Modeler ausgew hlt ist Der Expert Modeler ermitt
106. ige Beobachtungen verbleiben autoaccidents sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Versicherungsanalysten geht ein Modell zur Anzahl der Autounf lle pro Fahrer unter Ber cksichtigung von Alter und Geschlecht zu erstellen Jeder Fall stellt einen Fahrer dar und erfasst das Geschlecht des Fahrers sein Alter in Jahren und die Anzahl der Autounf lle in den letzten f nf Jahren band sav Diese Datendatei enth lt die hypothetischen w chentlichen Verkaufszahlen von CDs f r eine Musikgruppe Daten f r drei m gliche Einflussvariablen wurden ebenfalls aufgenommen bankloan sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Bank geht den Anteil der nicht zur ckgezahlten Kredite zu reduzieren Die Datei enth lt Informationen zum Finanzstatus und demografischen Hintergrund von 850 fr heren und potenziellen Kunden Bei den ersten 700 F llen handelt es sich um Kunden denen bereits ein Kredit gew hrt wurde Bei den letzten 150 F llen handelt es sich um potenzielle Kunden deren Kreditrisiko die Bank als gering oder hoch einstufen m chte bankloan_binning sav Hierbei handelt es sich um eine hypothetische Datendatei die Informationen zum Finanzstatus und demografischen Hintergrund von 5 000 fr heren Kunden enth lt behavior sav In einem klassischen Beispiel Price als auch Bouffard 1974 wurden 52 Sch ler Studenten gebeten die Komb
107. inationen aus 15 Situationen und 15 Verhaltensweisen auf einer 10 Punkte Skala von 0 ausgesprochen angemessen bis 9 ausgesprochen unangemessen zu bewerten Die Werte werden ber die einzelnen Personen gemittelt und als Un hnlichkeiten verwendet behavior_ini sav Diese Datendatei enth lt eine Ausgangskonfiguration f r eine zweidimensionale L sung f r behavior sav brakes sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Qualit tskontrolle in einer Fabrik geht die Scheibenbremsen f r Hochleistungsautomobile herstellt Die Datendatei enth lt Messungen des Durchmessers von 16 Scheiben aus 8 Produktionsmaschinen Der Zieldurchmesser f r die Scheiben ist 322 Millimeter breakfast sav In einer klassischen Studie Green als auch Rao 1972 wurden 21 MBA Studenten der Wharton School mit ihren Lebensgef hrten darum gebeten 15 Fr hst cksartikel in der Vorzugsreihenfolge von 1 am meisten bevorzugt bis 15 am wenigsten bevorzugt zu ordnen Die Bevorzugungen wurden in sechs unterschiedlichen Szenarien erfasst von Overall preference Allgemein bevorzugt bis Snack with beverage only Imbiss nur mit Getr nk breakfast overall sav Diese Datei enth lt die Daten zu den bevorzugten Fr hst cksartikeln allerdings nur f r das erste Szenario Overall preference Allgemein bevorzugt broadband_1 sav Hierbei handelt es sich um eine hypothetische Datendatei die die
108. ing 233 South Wacker Drive 11th Floor Chicago IL 60606 6412 ber dieses Handbuch In diesem Handbuch wird die grafische Benutzeroberfl che f r die in SPSS Trends Erweiterungsmodul enthaltenen Prozeduren erl utert Die Abbildungen der Dialogfelder stammen aus SPSS Detaillierte Informationen zur Befehlssyntax f r die Funktionen in SPSS Trends Erweiterungsmodul sind auf zwei Arten verf gbar als Bestandteil des umfassenden Hilfesystems und als separates Dokument im PDF Format im Handbuch SPSS 16 0 Command Syntax Reference das auch ber das Men Hilfe verf gbar ist Kontakt zu SPSS Wenn Sie in unseren Verteiler aufgenommen werden m chten wenden Sie sich an eines unserer B ros die Sie auf unserer Website unter http www spss com worldwide finden iv Inhalt Teil I Benutzerhandbuch 1 Einf hrung in Zeitreihen 1 Zeitreihendaten 2 2 tte eee 1 Transformieren von Daten 00 0 cc eee ett ete ee 2 Sch tz und Validierungsperioden 0 0 c cece eee eee 2 Erstellen von Modellen und Vorhersagen 0 0 0 0 cece eee ee te eee e nee 2 2 Zeitreihenmodellierung 4 Angeben von Optionen f r den Expert Modeler 0 0000 e cece eee eee eee 8 Modellauswahl und Ereignisspezifikation 0 0 000 c cece eee eee 8 Behandeln von Ausrei ern mit dem Expert Modeler 0 020 cece ee eeeee 9 Exponentielles Gl tten Benutzerdefinierte Modelle nnna nunnana 10 Ben
109. ionalen M rkten aufstellen Sie haben bereits Modelle mit dem Expert Modeler erstellt und eine Vorhersage ber drei Monate angefertigt Das Data Warehouse wurde mit tats chlichen Daten f r die urspr ngliche Vorhersageperiode aktualisiert Daher m chten Sie den Vorhersagehorizont mithilfe dieser Daten um weitere drei Monate erweitern Die aktualisierten fr heren monatlichen Daten befinden sich in broadband _2 sav und die gespeicherten Modelle in broadband _models xml F r weitere Informationen siehe Beispieldateien in Anhang D auf S 108 Wenn Sie das vorhergehende Beispiel durchgearbeitet und eine eigene Modelldatei gespeichert haben k nnen Sie selbstverst ndlich anstelle von broadband_models xml Ihre eigene Datei verwenden Durchf hrung der Analyse So weisen Sie Modelle zu W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Modelle zuweisen 60 61 Neuprognosen f r gro e Datenmengen durch das Zuweisen gespeicherter Modelle Abbildung 7 1 Dialogfeld Zeitreihenmodell zuweisen E Zeitreihenmodell zuweisen Modelle Statistik Diagramme Ausgabefilter Speichern Optionen Modelldatei C Pragramme SPS5 Tutorial sample_files broadband_models xml Modellparameter und Ma e der G te der Anpassung Aus Modelldatei laden Erneut aus den Daten sch tzen Sch tzperiode Start Erster Fall Ende Letzter Fall Vorhersageperiode O Erster Fall nach der Sch tzperiode b
110. is letzter Fall in der Arbeitsdatei Erster Fall nach der Sch tzperiode bis zum angegebenen Datum Datum Jahr Monat 2004 6 gt Klicken Sie auf Durchsuchen und wechseln Sie dann zu der Datei broadband_models xml und w hlen Sie sie aus alternativ k nnen Sie auch Ihre eigene Modelldatei aus dem vorhergehenden Beispiel ausw hlen F r weitere Informationen siehe Beispieldateien in Anhang D auf S 108 Der Pfad von broadband_models xml oder der eigenen Modelldatei wird nun auf der Registerkarte Modelle angezeigt W hlen Sie Erneut aus den Daten sch tzen aus Um neue Werte der Zeitreihe in Vorhersagen aufzunehmen m ssen die Modellparameter mit der Prozedur Zeitreihenmodell zuweisen erneut gesch tzt werden Die Struktur der Modelle bleibt jedoch unver ndert sodass f r die Neusch tzung wesentlich weniger Rechenzeit als beim ersten Erstellen der Modelle erforderlich ist Die f r die Neusch tzung verwendete Gruppe von F llen muss die neuen Daten enthalten Wenn Sie die Standardsch tzperiode von Erster Fall bis Letzter Fall verwenden ist dies sichergestellt Wenn Sie als Sch tzperiode einen anderen als den Standardwert festlegen m ssen k nnen Sie im Dialogfeld F lle ausw hlen die Option Nach Zeit oder Fallbereich ausw hlen gt Wahlen Sie im Gruppenfeld Vorhersageperiode die Option Erster Fall nach der Schatzperiode bis zum angegebenen Datum aus 62 Kapitel 7
111. ische Datendatei bei der es um Bem hungen geht die ffentliche Unterst tzung f r einen Gesetzentwurf zu ermitteln bevor er im Parlament eingebracht wird Die F lle entsprechen registrierten W hlern F r jeden Fall sind County Gemeinde und Wohnviertel des W hlers erfasst poll_cs_sample sav Diese hypothetische Datendatei enth lt eine Stichprobe der in poll_cs sav aufgef hrten W hler Die Stichprobe wurde gem dem in der Plandatei poll csplan angegebenen Stichprobenplan gezogen und in dieser Datendatei sind die Einschlusswahrscheinlichkeiten und Stichprobengewichtungen erfasst Beachten Sie jedoch Folgendes Da im Stichprobenplan die PPS Methode PPS probability proportional to size Wahrscheinlichkeit proportional zur Gr e verwendet wird gibt es au erdem eine Datei mit den gemeinsamen Auswahlwahrscheinlichkeiten poll_jointprob sav Die zus tzlichen Variablen zum demografischen Hintergrund der W hler und ihrer Meinung zum vorgeschlagenen Gesetzentwurf wurden nach der Ziehung der Stichprobe erfasst und zur Datendatei hinzugef gt property_assess sav Hierbei handelt es sich um eine hypothetische Datendatei in der es um die Bem hungen eines f r einen Bezirk County zust ndigen Immobilienbewerters geht trotz eingeschr nkter Ressourcen die Einsch tzungen des Werts von Immobilien auf dem aktuellsten Stand zu halten Die F lle entsprechen den Immobilien die im vergangenen Jahr in dem betreffenden County verkauft wurden
112. itel 11 Zum Verst ndnis des Periodogramms und der Spektraldichte Abbildung 11 2 Periodogramm 1 319E9 4 852E8 1 785E8 E 6 566E7 5 D 2 415E7 v o 15 8886E6 3 269E6 1 203E6 4 424E5 0 0 0 1 0 2 Frequenz 0 3 0 4 o in Das Periodogramm zeigt eine Folge von Spitzen die aus dem Hintergrundrauschen hervortreten Die Spitze mit der niedrigsten Frequenz liegt bei einer Frequenz von knapp unter 0 1 Sie vermuten dass die Daten eine j hrliche periodische Komponente aufweisen Daher m ssen Sie den Beitrag ber cksichtigen den eine j hrliche Komponente zu dem Periodogramm leisten w rde Jeder Datenpunkt in der Zeitreihe steht f r einen Monat Daher entspricht eine j hrliche Periodizit t im aktuellen Daten Set einer Periode von 12 Da Periode und Frequenz Kehrwerte voneinander sind entspricht eine Periode von 12 einer Frequenz von 1 12 bzw 0 083 Eine j hrliche Komponente impliziert also eine Spitze im Periodogramm bei 0 083 was mit dem Vorhandensein der Spitze knapp unterhalb einer Frequenz von 0 1 konsistent zu sein scheint Abbildung 11 3 Tabelle f r univariate Statistiken Name der Reihe men 00000 00833 01667 02500 03333 04167 05000 05833 06667 07500 08333 09167 10000 os One WON 222 0 on O 000 3696 643 1496 277 1336 400 662 146 1654 614 784 814 335 646 1094178 264 554 3053 934 978 882 403 128
113. itreihen Modelle zuweisen 84 Kapitel 9 Abbildung 9 8 Dialogfeld Zeitreihenmodell zuweisen E Zeitreihenmodell zuweisen Modelle Statistik Diagramme Ausgabefilter Speichern Optionen Modelldatei C Programme SP55 Tutorialisample_files catalog_model xml Modellparameter und Ma e der G te der Anpassung Aus Modelldatei laden Erneut aus den Daten sch tzen Sch tzperiode Vorhersageperiode O Erster Fall nach der Sch tzperiode bis letzter Fall in der Arbeitsdatei Erster Fall nach der Sch tzperiode bis zum angegebenen Datum p gt Klicken Sie auf Durchsuchen und wechseln Sie dann zu der Datei catalog_model xml und w hlen Sie sie aus alternativ k nnen Sie auch Ihre eigene Modelldatei aus dem vorhergehenden Beispiel ausw hlen F r weitere Informationen siehe Beispieldateien in Anhang D auf S 108 Der Pfad von catalog_model xml oder der eigenen Modelldatei wird nun auf der Registerkarte Modelle angezeigt W hlen Sie im Gruppenfeld Vorhersageperiode die Option Erster Fall nach der Sch tzperiode bis zum angegebenen Datum aus gt Geben Sie im Datumsgitter f r das Jahr 1999 und f r den Monat 3 ein Klicken Sie auf die Registerkarte Statistik 85 Untersuchen von Einflussvariablen durch das Zuweisen gespeicherter Modelle Abbildung 9 9 Zeitreihenmodell zuweisen Registerkarte Statistik E Zeitreihenmodell zuweisen Modelle Statistik Diagram
114. itreihenmodell zuweisen 37 124 Index in Zeitreihenmodellierung 22 Vorhersagen in Zeitreihenmodell zuweisen 31 33 85 in Zeitreihenmodellierung 17 19 55 Vorhersageperiode in Zeitreihenmodell zuweisen 29 61 84 in Zeitreihenmodellierung 7 24 52 53 Vorhersagetabelle in Zeitreihenmodell zuweisen 85 in Zeitreihenmodellierung 59 Wurzel der mittleren Fehler Quadratsumme 101 in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 XML erneut gesch tzte Modelle als XML speichern 37 Zeitreihenmodelle als XML speichern 22 54 71 Zeitreihenmodell zuweisen 27 60 77 am besten schlechtesten angepasste Modelle 35 Anpassungsg te des Modells Tabelle 63 Anpassungswerte 33 Box Ljung Statistik 31 erneut gesch tzte Modelle als XML speichern 37 Fehlende Werte 38 Konfidenzintervalle 33 38 Modellparameter 31 Modellparameter erneut sch tzen 29 61 neue Variablennamen 37 64 Partielle Residuen Autokorrelationsfunktion 31 33 Residuen Autokorrelationsfunktion 31 33 Sch tzperiode 29 Statistik f r alle Modelle 31 33 63 Statistik f r Anpassungsg te 31 33 63 Vorhersagen 31 33 85 Vorhersagen speichern 37 62 Vorhersageperiode 29 61 84 Vorhersagetabelle 85 Zeitreihenmodellierung 4 am besten schlechtesten angepasste Modelle 21 Anpassungswerte 19 73 ARIMA 7 12 ARIMA Modellparameter Tabelle 76 Ausrei er 9 16 70 Box Ljung Statistik 17 Ereignis
115. lake C L als auch C J Merz 1998 UCI Repository of machine learning databases Available at http www ics uci edu mlearn MLRepository html Box G E P G M Jenkins als auch G C Reinsel 1994 Time series analysis Forecasting and control 3rd Hg Englewood Cliffs N J Prentice Hall Breiman L als auch J H Friedman 1985 Estimating optimal transformations for multiple regression and correlation Journal of the American Statistical Association 80 580 598 Collett D 2003 Modelling survival data in medical research 2 Hg Boca Raton Chapman amp Hall CRC Gardner E S 1985 Exponential smoothing The state of the art Journal of Forecasting 4 1 28 Green P E als auch V Rao 1972 Applied multidimensional scaling Hinsdale Ill Dryden Press Green P E als auch Y Wind 1973 Multiattribute decisions in marketing A measurement approach Hinsdale Ill Dryden Press Greenacre M J 1984 Theory and applications of correspondence analysis London Academic Press Guttman L 1968 A general nonmetric technique for finding the smallest coordinate space for configurations of points Psychometrika 33 469 506 Hartigan J A 1975 Clustering algorithms New York John Wiley and Sons Hastie T als auch R Tibshirani 1990 Generalized additive models London Chapman and Hall Kennedy R C Riquier als auch B Sharp 1996 Practical applications of correspondence analysis to cate
116. le Modelle sind nur verf gbar wenn f r die Arbeitsdatei eine Periodizit t definiert wurde siehe im Folgenden unter Aktuelle Periodizit t m Einfach Dieses Modell eignet sich f r Zeitreihen bei denen weder Trend noch Saisonalit t vorliegen Sein einziger Gl ttungsparameter betrifft das Niveau Einfaches exponentielles Gl tten weist eine sehr gro e hnlichkeit auf mit einem ARIMA Modell mit Autoregression der Ordnung null Differenzenbildung der Ordnung 1 gleitenden Durchschnitten der Ordnung 1 und fehlender Konstante 11 Zeitreihenmodellierung Holt Modell mit linearem Trend Dieses Modell eignet sich f r Zeitreihen die einen linearen Trend aber keine Saisonalit t aufweisen Seine Gl ttungsparameter betreffen Niveau und Trend und es wird angenommen dass die Werte dieser beiden Elemente unabh ngig voneinander sind Das Holt Modell ist allgemeiner als das Brown Modell aber es kann bei langen Zeitreihen mehr Rechenzeit erfordern Exponentielles Gl tten mit Holt Modell weist eine sehr gro e hnlichkeit auf mit einem ARIMA Modell mit Autoregression der Ordnung 0 Differenzenbildung der Ordnung 2 und gleitenden Durchschnitten der Ordnung 2 Brown Modell mit linearem Trend Dieses Modell eignet sich f r Zeitreihen die einen linearen Trend aber keine Saisonalit t aufweisen Seine Gl ttungsparameter betreffen Niveau und Trend und es wird angenommen dass diese Faktoren gleich sind Das Brown Modell ist daher ein S
117. le Spitzen mit unregelm igem Abstand sodass eine etwaige zugrunde liegende Periodizit t nicht ersichtlich ist Verwenden Sie die Prozedur Spektraldiagramme um eine etwaige Periodizit t in den Absatzdaten zu identifizieren Durchf hrung der Analyse So f hren Sie die Prozedur Spektraldiagramme durch W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Spektralanalyse 96 97 Spektraldiagramme Abbildung 11 1 Dialogfeld Spektraldiagramme E Spekt raldiagramme Z Variable n 2 Date date Sales of Men s Clothing men 2 Sales of Women s Clothing wom 8 Sales of Jewelry jewel L Number of Catalogs Mailed mail pektral Fenster 8 Number of Pages in Catalog page Number of Phone Lines Open for Tukey Hamming o Amount Spent on Print Advertisin k 4 Number of Customer Service Rep m b V variablen zentrieren Bivariate Analyse Erste Variable mit jeder Diagramm Y Periodogramm M Ko Spektraldichte Quadratische Koh renz aii Quadraturspektrum Phasenspektrum Kreuzamplitude Gewinn Nach Frequenz O Nach Periode Wahlen Sie die Variable Sales of Men s Clothing aus und verschieben Sie sie in die Liste Variablen W hlen Sie im Gruppenfeld Diagramm die Option Spektraldichte aus Klicken Sie auf OK 93 Kap
118. legung 40 Saisonale Zerlegung Speichern 0 00 cece teens 42 Zus tzliche Funktionen beim Befehl SEASON 22 cc cn nn 43 5 Spektraldiagramme 44 Zus tzliche Funktionen beim Befehl SPECTRA 0 00000 ccc c cece eee eee 47 Teil II Beispiele 6 Prognosen f r gro e Datenmengen mit dem Expert Modeler 49 Untersuchen der Daten 00 00 cet e eee eens 49 Durchf hrung der Analyse 2 0 0 0 00 c cece ete eee 51 Diagramme f r die Modellzusammenfassung 00 cece eee e eee eee eee 57 Modellvorhersagen 0 0 0 ce cece n ete eeeeee 58 ZUSAMMENTASSUNG feds dee das od ea ees pa dees oe dade dad es dabei tan las 59 7 Neuprognosen f r gro e Datenmengen durch das Zuweisen gespeicherter Modelle 60 Durchf hrung der Analyse 2 0 0 0 cece ene eee eee 60 Statistiken zur Anpassungsg te des Modells 00000 c eee eee eee 63 Modellvorhersagen 0 0 cece ccc nennen een en 64 ZusammenfasSSUNng 2 2 rennen een en 64 vi 8 Ermitteln von signifikanten Einflussvariablen mit dem Expert Modeler Erstellen von Diagrammen aus den Daten 0 0 0 cc cette eens Durchf hrung der Analyse 0 0 0 0 0 ccc ccc een en ee nent eee eens ZeitreihendiagraMM esee anai adiada ee ee nen ee een a e ene Tabelle der Modellbeschreibung 0 ccc ee ene teen eens Tabelle der Modellstatistik 0 0 0 0 00 cect ett Tabelle der ARIMA Modellparameter 0 0 0
119. les ein wie im Daten Editor angezeigt Die Spalte Zyklus im Datumsgitter sofern vorhanden bezieht sich auf die Werte der Variablen CYCLE _ in der Arbeitsdatei Ausgabe Als Ausgabe stehen sowohl Ergebnisse f r einzelne Modelle als auch Ergebnisse f r alle Modelle zur Verf gung Die Ergebnisse f r einzelne Modelle k nnen ber vom Benutzer angegebene Kriterien auf eine Gruppe von am besten schlechtesten angepassten Modellen eingeschr nkt werden 31 Zeitreihenmodell zuweisen Statistiken und Vorhersagetabellen Abbildung 3 2 Zeitreihenmodell zuweisen Registerkarte Statistik E Zeitreihenmodellierung Yariablen Statistik Diagramme Ausgabefilter Speichern Optionen I Anpassungsmafie Ljung Box Statistik und Anzahl von Ausreifiern nach Modell anzeigen Anpassungsma e R Quadrat f r station ren Teil Mittlerer absoluter Fehler CI R Quadrat C Maximaler absoluter Fehler in Prozent C wurzel der mittleren Fehler Quadratsumme C Maximaler absoluter Fehler C Mittlerer absoluter Fehler in Prozent _ Normalisiertes BIC Statistik Fir Modellvergleich Statistik nach einzelnen Modellen G te der Anpassung Parametersch tzer Residuen Autokorrelationsfunktion ACF Residuen Autokorrelationsfunktion ACF Part Residuen Autokorrelationsfunktion PACF C Part Residuen Autokorrelationsfunktion PACF Die Registerkarte Statistik enth lt Optionen mit denen Tabellen f r Statistiken
120. ll anzeigen Anpassungsma e R Quadrat f r station ren Teil _ R Quadrat C Mittlerer absoluter Fehler C Maximaler absoluter Fehler in Prozent C wurzel der mittleren Fehler Quadratsumme C Maximaler absoluter Fehler Mittlerer absoluter Fehler in Prozent C Normalisiertes BIC Statistik Fir Modellvergleich Statistik nach einzelnen Modellen G te der Anpassung _ Residuen Autokorrelationsfunktion ACF C Residuen Autokorrelationsfunktion ACF C Part Residuen Autokorrelationsfunktion PACF C Part Residuen Autokorrelationsfunktion PACF Fl Vorhersagen anzeigen W hlen Sie Parametersch tzer aus Mit dieser Option wird eine Tabelle erstellt die alle Parameter f r das vom Expert Modeler gew hlte Modell einschlie lich der signifikanten Einflussvariablen enth lt Klicken Sie auf die Registerkarte Diagramme 73 Ermitteln von signifikanten Einflussvariablen mit dem Expert Modeler Abbildung 8 7 Zeitreihenmodellierung Registerkarte Diagramme a E Zeitreihenmodellierung Variablen Statistik Diagramme Ausgabefilter Speichern Optionen Diagramme zum Vergleichen von Modellen _ R Quadrat f r station ren Teil C Maximaler absoluter Fehler in Prozent EIR Quadrat C Maximaler absoluter Fehler C wurzel der mittleren Fehler Quadratsumme _ Normalisiertes BIC C Mittlerer absoluter Fehler in Prozent Residuen Autokorrelationsfunktion ACF
121. lle enthalten F r jede Option wird eine eigene Tabelle erstellt Sie k nnen eine oder mehrere der folgenden Optionen ausw hlen G te der Anpassung Tabelle der Auswertungsstatistiken und Perzentile f r R Quadrat f r station ren Teil R Quadrat Wurzel der mittleren Fehler Quadratsumme mittlerer absoluter Fehler in Prozent mittlerer absoluter Fehler maximaler absoluter Fehler in Prozent maximaler absoluter Fehler und normalisiertes Bayes Informationskriterium Residuen Autokorrelationsfunktion ACF Tabelle der Auswertungsstatistiken und Perzentile f r Autokorrelationen der Residuen f r alle gesch tzten Modelle Diese Tabelle ist nur verf gbar wenn die Modellparameter erneut gesch tzt werden Erneut aus den Daten sch tzen auf der Registerkarte Modelle Part Residuen Autokorrelationsfunktion PACF Tabelle der Auswertungsstatistiken und Perzentile f r partielle Autokorrelationen der Residuen f r alle gesch tzten Modelle Diese Tabelle ist nur verf gbar wenn die Modellparameter erneut gesch tzt werden Erneut aus den Daten sch tzen auf der Registerkarte Modelle Statistik nach einzelnen Modellen Mit dieser Gruppe von Optionen wird die Anzeige der Tabellen gesteuert die detaillierte Informationen zu den einzelnen Modellen enthalten F r jede Option wird eine eigene Tabelle erstellt Sie k nnen eine oder mehrere der folgenden Optionen ausw hlen Parametersch tzer Zeigt f r jedes Modell eine Tabelle der P
122. lle mit Pr diktoren werden nicht erneut gesch tzt m Wenn unabh ngige Variablen innerhalb der Vorhersageperiode fehlende Werte aufweisen gibt die Prozedur eine Warnung aus und f hrt die Vorhersage auf der Grundlage der vorhandenen Werte aus Konfidenzintervallbreite Konfidenzintervalle werden f r die Modellvorhersagen und Residuen Autokorrelationen berechnet Es kann ein beliebiger positiver Wert unter 100 angegeben werden In der Standardeinstellung wird ein Konfidenzintervall von 95 verwendet In ACF und PACF Ausgabe angezeigte maximale Anzahl von Intervallen Sie k nnen die H chstanzahl von Intervallen festlegen die in Tabellen und Diagrammen f r Autokorrelationen und partielle Autokorrelationen angezeigt werden Diese Option ist nur verf gbar wenn die Modellparameter erneut gesch tzt werden Erneut aus den Daten sch tzen auf der Registerkarte Modelle Zus tzliche Funktionen beim Befehl TSAPPLY Ihnen stehen zus tzliche Funktionen zur Verf gung wenn Sie Ihre Auswahl in ein Syntax Fenster einf gen und die resultierende Befehlssyntax f r den Befehl TSAPPLY bearbeiten Mit der Befehlssyntax Sprache verf gen Sie ber folgende M glichkeiten m Festlegen dass der Arbeitsdatei nur eine Untergruppe der Modelle in einer Modelldatei zugewiesen werden mit den Schl sselw rtern DROP und KEEP im Unterbefehl MODEL m Den Daten Modelle aus zwei oder mehr Modelldateien zuweisen mit dem Unterbefehl MODEL So k nn
123. llen von Auswertungsstatistiken f r alle gesch tzten Modelle Angeben von bertragungsfunktionen f r unabh ngige Variablen in ARIMA Modellen Aktivieren der automatischen Erkennung von Ausrei ern Modellspezifische Zeitpunkte als Ausrei er f r benutzerdefinierte ARIMA Modelle Modellierungsmethode Die folgenden Modellierungsmethoden sind verf gbar Expert Modeler Der Expert Modeler ermittelt automatisch das jeweils am besten angepasste Modell f r die einzelnen abh ngigen Zeitreihen Wenn unabh ngige Variablen Pr diktoren angegeben sind w hlt der Expert Modeler f r den Einschluss in ARIMA Modelle diejenigen aus die eine statistisch signifikante Beziehung mit der abh ngigen Zeitreihe aufweisen Modellvariablen werden ggf durch Differenzierung und oder Quadratwurzeltransformation bzw Transformation mit nat rlichem Logarithmus transformiert Der Expert Modeler ber cksichtigt in der Standardeinstellung sowohl Modelle mit exponentiellem Gl tten als auch ARIMA Modelle Sie k nnen den Expert Modeler jedoch auch auf die ausschlie liche Suche nach ARIMA Modellen bzw nach Modellen mit exponentiellem Gl tten einschr nken Sie k nnen auch die automatische Erkennung von Ausrei ern festlegen Exponentielles Gl tten Mit dieser Option k nnen Sie ein benutzerdefiniertes Modell mit exponentiellem Gl tten angeben Dabei k nnen Sie zwischen verschiedenen Modellen mit exponentiellem Gl tten w hlen die sich hinsichtlich der Behand
124. llierung 8 Expert Modeler 7 49 Ausrei er 9 70 Modellraum einschr nken 8 52 Index Fehlende Werte in Zeitreihenmodell zuweisen 38 in Zeitreihenmodellierung 24 Ged mpftes Modell mit exponentiellem Gl tten 10 Gleitender Durchschnitt ARIMA Modelle 13 G te der Anpassung Definitionen 101 in Zeitreihenmodell zuweisen 31 33 63 in Zeitreihenmodellierung 17 19 55 Harmonische Analyse 44 Historische Daten in Zeitreihenmodell zuweisen 33 in Zeitreihenmodellierung 19 Historische Periode 2 Im Niveau verschobener Ausrei er 103 in Zeitreihenmodellierung 9 16 Innovativer Ausrei er 103 in Zeitreihenmodellierung 9 16 Integration ARIMA Modelle 13 Konfidenzintervalle in Zeitreihenmodell zuweisen 33 38 in Zeitreihenmodellierung 19 24 Log Transformation in Zeitreihenmodellierung 10 12 14 Lokaler Trend Ausrei er 103 in Zeitreihenmodellierung 9 16 MAE 101 in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 MAPE 101 in Zeitreihenmodell zuweisen 31 33 64 in Zeitreihenmodellierung 17 19 56 MaxAE 101 in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 MaxAPE 101 in Zeitreihenmodell zuweisen 31 33 64 in Zeitreihenmodellierung 17 19 56 Maximaler absoluter Fehler 101 in Zeitreihenmodell zuweisen 31 33 in Zeitreihenmodellierung 17 19 122 123 Maximaler absoluter Fehler in Prozent 101 in Zeitreihenmodell zuweis
125. lung von Trends und Saisonalit t unterscheiden ARIMA Mit dieser Option k nnen Sie ein ARIMA Modell angeben Hierf r m ssen autoregressive Ordnungen Ordnungen f r gleitenden Durchschnitt und der Grad der Differenzierung angegeben werden Sie k nnen unabh ngige Variablen Pr diktoren einschlie en und f r einige oder alle bertragungsfunktionen definieren Au erdem k nnen Sie die automatische Erkennung von Ausrei ern oder eine bestimmte Gruppe von Ausrei ern angeben Sch tz und Vorhersageperioden Sch tzperiode Die Sch tzperiode gibt die Gruppe von F llen an anhand derer das Modell bestimmt wird In der Standardeinstellung umfasst die Sch tzperiode s mtliche F lle in der Arbeitsdatei Sie k nnen die Sch tzperiode festlegen indem Sie im Dialogfeld F lle ausw hlen die Option Nach Zeit oder Fallbereich ausw hlen Die von der Prozedur verwendete Sch tzperiode kann je nach den verf gbaren Daten unterschiedliche abh ngige Variablen verwenden und daher vom angezeigten Wert abweichen Die tats chliche Sch tzperiode f r eine bestimmte abh ngige Variable entspricht der Zeitspanne die verbleibt nachdem die direkt aufeinander folgenden fehlenden Werte von der Variablen entfernt wurden am Anfang oder am Ende der angegebenen Sch tzperiode 8 Kapitel 2 Vorhersageperiode Die Vorhersageperiode beginnt mit dem ersten Fall nach der Sch tzperiode und reicht in der Standardeinstellung bis zum letzten Fall in de
126. m die berlebenszeiten von Patienten die nach einem Rehabilitationsprogramm wegen eines isch mischen Schlaganfalls mit einer Reihe von Problemen zu k mpfen haben Nach dem Schlaganfall werden das Auftreten von Herzinfarkt isch mischem Schlaganfall und h morrhagischem Schlaganfall sowie der Zeitpunkt des Ereignisses aufgezeichnet Die Stichprobe ist auf der linken Seite abgeschnitten da sie nur Patienten enth lt die bis zum Ende des Rehabilitationprogramms das nach dem Schlaganfall durchgef hrt wurde berlebten stroke_valid sav Diese hypothetische Datendatei enth lt den Zustand einer medizinischen Datenbank nachdem diese mithilfe der Prozedur Daten validieren berpr ft wurde Sie enth lt immer noch potenziell anomale F lle tastetest sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Bewertung der Auswirkungen der Mulchfarbe auf den Geschmack von Pflanzenprodukten geht Der Geschmack von Erdbeeren die in rotem blauem und schwarzem Rindenmulch gezogen wurden wurde von Testpersonen auf einer ordinalen Skala weit unter bis weit ber dem Durchschnitt bewertet Jeder Fall entspricht einem Geschmackstester 118 Anhang D telco sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Telekommunikationsunternehmens geht die Kundenabwanderung zu verringern Jeder Fall entspricht einem Kunden und enth lt verschiedene Informationen zum demografischen Hin
127. me Ausgabefilter Speichern Optionen Anpassungsma e Liung Box Statistik und Anzahl von Ausrei ern nach Modell anzeigen Anpassungsma e R Quadrat f r station ren Teil C Mittlerer absoluter Fehler _ R Quadrat C Maximaler absoluter Fehler in Prozent C Wurzel der mittleren Fehler Quadratsumme C Maximaler absoluter Fehler C Mittlerer absoluter Fehler in Prozent _ Normalisiertes BIC Statistik Fir Modellvergleich Statistik nach einzelnen Modellen G te der Anpassung Parametersch tzer W hlen Sie Vorhersagen anzeigen aus Hierdurch wird eine Tabelle von vorhergesagten Werten f r die abh ngige Variable ausgegeben gt Klicken Sie im Dialogfeld Zeitreihenmodell zuweisen auf OK Abbildung 9 10 Vorhersagetabelle moden yan ses FeB1999 Im r ses Sales of Men s vYorhersagen 25279 91 22064 72 21580 96 Clothing Model_1 UCL 27591 62 24376 42 23892 66 LCL 22968 21 19753 02 19269 25 Die Tabelle der Vorhersagen enth lt die vorhergesagten Werte der abh ngigen Datenreihe unter Ber cksichtigung der beiden Einflussvariablen mail und phone in der Vorhersageperiode Die Tabelle enth lt au erdem die obere Konfidenzgrenze UCL und die untere Konfidenzgrenze LCL f r die Vorhersagen Sie haben die Umsatzvorhersage f r das Szenario erstellt bei dem Sie 2000 zus tzliche Kataloge pro Monat versenden Nun bereiten Sie die Daten f r das Szenario vor bei dem Sie zus tzliche Telefo
128. n saisonaler Schwankungen einer Zeitreihe ergeben STC Gegl ttete Trend Zyklus Komponenten engl Smoothed Trend Cycle Components Diese Werte zeigen den Trend und das zyklische Verhalten in einer Zeitreihe an ERR Residuen oder fehlerhafte Werte engl Error Die Werte die nach dem Entfernen der saisonalen Trend und Zyklus Komponenten verbleiben 43 Saisonale Zerlegung Zus tzliche Funktionen beim Befehl SEASON Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Angabe einer etwaigen Periodizit t im Befehl SEASON anstatt eine der Alternativen der Prozedur Datum definieren auszuw hlen Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel Spektraldiagramme Die Prozedur Spektraldiagramme wird zur Identifizierung von periodischem Verhalten bei Zeitreihen verwendet Anstatt die Schwankungen von einem Zeitpunkt zum n chsten zu analysieren werden die Schwankungen der Zeitreihe als Ganzes in periodischen Komponenten unterschiedlicher Frequenzen analysiert Glatte Zeitreihen weisen st rkere periodische Komponenten bei niedrigen Frequenzen auf durch Zufallsschwankungen wei es Rauschen wird die Komponentenst rke ber alle Frequenzen verteilt Zeitreihen die fehlende Daten enthalten k nnen mit dieser Prozedur nicht analysiert werden Beispiel Die Neubauquote ist ein wichtiger Standardwert f r die gesamtwirtschaftliche L
129. nem saisonalen Effekt der nicht vom Niveau der Zeitreihe abh ngt Seine Gl ttungsparameter betreffen Niveau Trend und Saison Exponentielles Gl tten mit dem additiven Winters Modell weist sehr gro e hnlichkeit auf mit einem ARIMA Modell mit Autoregression der Ordnung 0 Differenzenbildung der Ordnung 1 saisonaler Differenzenbildung der Ordnung 1 und gleitenden Durchschnitten der Ordnung p 1 wobei p die Anzahl der Zeitpunkte in einem Saisonintervall ist f r monatliche Daten ist p 12 Winters multiplikativ Dieses Modell eignet sich f r Zeitreihen mit einem linearen Trend und einem saisonalen Effekt der vom Niveau der Zeitreihe abh ngt Seine Gl ttungsparameter betreffen Niveau Trend und Saison Exponentielles Gl tten mit dem multiplikativen Winters Modell weist keine hnlichkeit zu irgendeinem ARIMA Modell auf Aktuelle Periodizit t Gibt die gegenw rtig f r die Arbeitsdatei definierte Periodizit t an sofern vorhanden Die aktuelle Periodizit t wird als Ganzzahl angegeben z B 12 f r eine j hrliche Periodizit t wobei jeder Fall einen Monat darstellt Wenn keine Periodizit t angegeben wurde wird der Wert Keine angezeigt F r saisonales Modelle muss eine Periodizit t angegeben werden Die Periodizit t wird im Dialogfeld Datum definieren angegeben Transformation abh ngiger Variablen Sie k nnen angeben dass f r alle abh ngigen Variablen vor der Modellierung eine Transformation durchgef hrt wird 12
130. nen Filialen einer Bank Jeder Fall entspricht einem Kunden und zeichnet die Wartezeit und die Filiale webusability sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Tests zur Benutzerfreundlichkeit eines neuen Internetgesch fts geht Jeder Fall entspricht einer von f nf Testpersonen die die Benutzerfreundlichkeit bewerten und gibt f r sechs separate Aufgaben an ob die Testperson sie erfolgreich ausf hren k nnte wheeze_steubenville sav Hierbei handelt es sich um eine Teilmenge der Daten aus einer Langzeitstudie zu den gesundheitlichen Auswirkungen der Luftverschmutzung auf Kinder Ware Dockery Spiro III Speizer als auch Ferris Jr 1984 Die Daten enthalten wiederholte bin re Messungen des Keuchens von Kindern aus Steubenville Ohio im Alter von 7 8 9 und 10 Jahren sowie eine unver nderlichen Angabe ob die Mutter im ersten Jahr der Studie rauchte oder nicht workprog sav Hierbei handelt es sich um eine hypothetische Datendatei zu einem Arbeitsprogramm der Regierung das versucht benachteiligten Personen bessere Arbeitspl tze zu verschaffen Eine Stichprobe potenzieller Programmteilnehmer wurde beobachtet Von diesen Personen wurden nach dem Zufallsprinzip einige f r die Teilnahme an dem Programm ausgew hlt Jeder Fall entspricht einem Programmteilnehmer Bibliografie Bell E H 1961 Social foundations of human behavior Introduction to the study of sociology New York Harper amp Row B
131. nfektionswahrscheinlichkeit hindeuten Bei 2 000 Blutproben von denen die H lfte mit HIV infiziert war wurde ein Labortest durchgef hrt hourlywagedata sav Hierbei handelt es sich um eine hypothetische Datendatei zum Stundenlohn von Pflegepersonal in Praxen und Krankenh usern mit unterschiedlich langer Berufserfahrung insure sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Versicherungsgesellschaft geht die die Risikofaktoren untersucht die darauf hinweisen ob ein Kunde die Leistungen einer mit einer Laufzeit von 10 Jahren abgeschlossenen Lebensversicherung in Anspruch nehmen wird Jeder Fall in der Datendatei entspricht einem Paar von Vertr gen je einer mit Leistungsforderung und der andere ohne wobei die beiden Versicherungsnehmer in Alter und Geschlecht bereinstimmen judges sav Hierbei handelt es sich um eine hypothetische Datendatei mit den Wertungen von ausgebildeten Kampfrichtern sowie eines Sportliebhabers zu 300 Kunstturnleistungen Jede Zeile stellt eine Leistung dar die Kampfrichter bewerteten jeweils dieselben Leistungen kinship_dat sav Rosenberg und Kim Rosenberg als auch Kim 1975 haben 15 Bezeichnungen f r den Verwandtschaftsgrad untersucht Tante Bruder Cousin Tochter Vater Enkelin Gro vater Gro mutter Enkel Mutter Neffe Nichte Schwester Sohn Onkel Die beiden Analytiker baten vier Gruppen von College Studenten zwei weibliche und zwei m nnliche Gruppen dies
132. nleitungen bereitstellen Dazu m ssen Sie die Variable mail auf die urspr nglichen Werte zur cksetzen und die Variable phone um 5 erh hen Sie k nnen mail 86 Kapitel 9 zur cksetzen indem Sie die Werte von Vorhersagewert_mail_Modell_1 in der Vorhersageperiode kopieren und die aktuellen Werte von mail in der Vorhersageperiode mit diesen Werten berschreiben Sie k nnen die Anzahl der Telefonleitungen entweder direkt im Daten Editor oder wie bei der Anzahl der Kataloge mithilfe des Dialogfelds Variable berechnen erh hen Der Wert muss f r jeden Monat in der Vorhersageperiode um 5 erh ht werden Um die Analyse durchzuf hren ffnen Sie das Dialogfeld Zeitreihenmodell zuweisen wie folgt erneut Klicken Sie in der Symbolleiste auf die Schaltfl che Zuletzt verwendete Dialogfelder W hlen Sie Zeitreinenmodell zuweisen aus Abbildung 9 11 Dialogfeld Zeitreihenmodell zuweisen E Zeitreihenmodell zuweisen Modelle Statistik Diagramme Ausgabefilter Speichern Optionen Modelldatei C Programmeispss Tutorial sample_files catalog_model xmi Modellparameter und Ma e der G te der Anpassung Aus Modelldatei laden Erneut aus den Daten sch tzen Sch tzperiode Vorhersageperiode Erster Fall nach der Sch tzperiode bis letzter Fall in der Arbeitsdatei Erster Fall nach der Schatzperiode bis zum angegebenen Datum paum EEE Jahr Monat gt Klicken Sie im Dialogfeld Zeitreihe
133. nmodell zuweisen Einschr nken der Ausgabe auf die am besten schlechtesten angepassten Modelle Abbildung 3 4 Zeitreihenmodell zuweisen Registerkarte Ausgabefilter E Zeitreihenmodell zuweisen ee Modelle Statistik Diagramme Ausgabefilter Speichern Optionen Modelle nach G te der Anpassung filtern Anzeigen Die Registerkarte Ausgabefilter enth lt Optionen mit denen sowohl Tabellen als auch Diagrammausgabe auf eine Untergruppe von Modellen beschr nkt werden kann Sie k nnen die Ausgabe mithilfe von Anpassungskriterien auf die am besten und oder am schlechtesten angepassten Modelle beschr nken In der Standardeinstellung sind alle Modelle in der Ausgabe enthalten Sofern die Modellparameter nicht erneut gesch tzt werden Erneut aus den Daten sch tzen auf der Registerkarte Modelle stammen die zum Filtern der Modelle verwendeten Werte der Anpassungsma e aus der Modelldatei und entsprechen den Daten die bei der Entwicklung oder letzten Aktualisierung des jeweiligen Modells verwendet wurden Am besten angepa te Modelle Aktivieren Sie diese Option um die am besten angepassten Modelle in die Ausgabe einzuschlie en W hlen Sie ein Ma f r Anpassungsg te und geben Sie die Anzahl von Modellen an die eingeschlossen werden sollen Die Auswahl dieser Option hindert Sie nicht daran auch die am schlechtesten angepassten Modelle auszuw hlen Die Ausgabe w rde in diesem Fall sowohl die am schlechtesten
134. nmodell zuweisen auf OK 87 Untersuchen von Einflussvariablen durch das Zuweisen gespeicherter Modelle Abbildung 9 12 Tabellen der Vorhersagen f r die beiden Szenarien Forecast with more catalogs Moen ________ uan sss rep 1999 mak 1999 Sales of Men s Vorhersagen 25279 91 22064 72 21580 96 Clothing Model_1 27591 62 24376 42 23892 66 22968 21 19753 02 19269 25 Forecast with more phone lines Mogen _______ uan ses FEB1999 mar1999 Sales of Men s Vorhersagen 23757 25 20542 06 20058 29 Clothing Model_1 26068 95 22853 76 22370 00 2144555 18230 35 17746 59 In den Tabellen der Vorhersagen f r die beiden Szenarien zeigt sich dass bei einer gesteigerten Anzahl versendeter Kataloge f r jeden der drei vorhergesagten Monate ca 1500 Dollar mehr Umsatz zu erwarten ist als bei mehr bereitgestellten Telefonleitungen Auf der Grundlage dieser Analyse sollten die Ressourcen zum Versenden 2000 zus tzlicher Kataloge eingesetzt werden Kapitel Saisonale Zerlegung Entfernen der Saisonalit t aus Verkaufsdaten Eine Katalogfirma interessiert sich f r die Modellierung des Aufw rtstrends im Absatz Ihres Herrenbekleidungssortiments anhand einer Menge von Einflussvariablen wie der Anzahl der versendeten Kataloge und der Anzahl der Telefonleitungen ber die eine Bestellung m glich ist Dazu hat das Unternehmen Daten ber die monatlichen Verkaufszahlen f r Herrenbekleidung be
135. nterteilt sind erhalten jeweils eine Standardschulung Zus tzlich erh lt Gruppe 2 eine technische Schulung und Gruppe 3 eine Praxisschulung Die einzelnen Mitarbeiter wurden am Ende der Schulung einem Test unterzogen und die erzielten Punkte wurden erfasst Jeder Fall in der Datendatei stellt einen Lehrgangsteilnehmer dar und enth lt die Gruppe der der Lehrgangsteilnehmer zugeteilt wurde sowie die von ihm in der Pr fung erreichte Punktzahl satisf sav Hierbei handelt es sich um eine hypothetische Datendatei zu einer Zufriedenheitsumfrage die von einem Einzelhandelsunternehmen in 4 Filialen durchgef hrt wurde Insgesamt wurden 582 Kunden befragt Jeder Fall gibt die Antworten eines einzelnen Kunden wieder screws sav Diese Datendatei enth lt Informationen zu den Eigenschaften von Schrauben Bolzen Muttern und Rei n geln Hartigan 1975 shampoo_ph sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Qualit tskontrolle in einer Fabrik f r Haarpflegeprodukte geht In regelm igen Zeitabst nden werden Messwerte von sechs separaten Ausgangschargen erhoben und ihr pH Wert erfasst Der Zielbereich ist 4 5 5 5 ships sav Ein an anderer Stelle McCullagh et al 1989 vorgestelltes und analysiertes Daten Set bezieht sich auf die durch Wellen verursachten Sch den an Frachtschiffen Die Vorfallsh ufigkeiten k nnen unter Angabe von Schiffstyp Konstruktionszeitraum und Betriebszeitraum gem einer Poisson Rat
136. ntspricht Dadurch entfallen einige der Variablen die w chentlichen nderungen unterworfen waren und der verzeichnete ausgegebene Betrag ist nun die Summe der Betr ge die in den vier Wochen der Studie ausgegeben wurden grocery_coupons sav Hierbei handelt es sich um eine hypothetische Datendatei die Umfragedaten enth lt die von einer Lebensmittelkette erfasst wurden die sich f r die Kaufgewohnheiten ihrer Kunden interessiert Jeder Kunde wird ber vier Wochen beobachtet und jeder Fall entspricht einer Kundenwoche und enth lt Informationen zu den Gesch ften in denen der Kunde einkauft sowie zu anderen Merkmalen beispielsweise welcher Betrag in der betreffenden Woche f r Lebensmittel ausgegeben wurde guttman sav Bell Bell 1961 legte eine Tabelle zur Darstellung m glicher sozialer Gruppen vor Guttman Guttman 1968 verwendete einen Teil dieser Tabelle bei der f nf Variablen die Aspekte beschreiben wie soziale Interaktion das Gef hl der Gruppenzugeh rigkeit die 113 Beispieldateien physische N he der Mitglieder und die Formalit t der Beziehung mit sieben theoretischen sozialen Gruppen gekreuzt wurden crowds Menschenmassen beispielsweise die Zuschauer eines Fu ballspiels audience Zuh rerschaften beispielsweise die Personen im Theater oder bei einer Vorlesung public ffentlichkeit beispielsweise Zeitungsleser oder Fernsehzuschauer mobs Mobs wie Menschenmassen jedoch mit we
137. on L Seasonal Adjusted Series for Sales s Methode Expert Modeler v Modelltyp Alle Modelle Unabh ngige Yariablen Sch tzperiode Vorhersageperiode Start Erster Fall Start Erster Fall nach der Sch tzperiode Ende Letzter Fall Ende Letzter Fall in der Arbeitsdatei W hlen Sie Number of Catalogs Mailed und Number of Phone Lines Open for Ordering als abh ngige Variablen aus Klicken Sie auf die Registerkarte Speichern 79 Untersuchen von Einflussvariablen durch das Zuweisen gespeicherter Modelle Abbildung 9 2 Zeitreihenmodellierung Registerkarte Speichern E Zeitreihenmodellierung Variablen Statistik Diagramme Ausgabefilter Speichern Optionen _ Variablen speichern Variablen Beschreibung Speichern Pr fix f r Variablennamen Vorhergesagte Werte v vorhersagewert Untere Konfidenzgrenzen l Obere Konfidenzgrenzen Residuum Rauschen F r jedes ausgew hlte Element wird je abh ngiger Variablen eine Variable gespeichert Modelldatei exportieren Datei W hlen Sie in der Spalte Speichern den Eintrag Vorhergesagte Werte aus und behalten Sie den Standardwert Vorhersagewert als Pr fix f r Variablennamen bei gt Klicken Sie auf die Registerkarte Optionen 80 Kapitel 9 Abbildung 9 3 Zeitreihenmodellierung Registerkarte Optionen EM Zeitreihenmodellierung Variablen Statistik Diagramme
138. peichern Optionen V Anpassungsmafie Ljung Box Statistik und Anzahl von Ausrei ern nach Modell anzeigen Anpassungsma e R Quadrat f r station ren Teil C Mittlerer absoluter Fehler EIR Quadrat C Maximaler absoluter Fehler in Prozent C wurzel der mittleren Fehler Quadratsumme C Maximaler absoluter Fehler C Mittlerer absoluter Fehler in Prozent _ Normalisiertes BIC Statistik Fir Modellvergleich Statistik nach einzelnen Modellen G te der Anpassung Parametersch tzer _ Residuen Autokorrelationsfunktion ACF Residuen Autokorrelationsfunktion ACF C Part Residuen Autokorrelationsfunktion PACF Part Residuen Autokorrelationsfunktion PACF 18 Kapitel 2 Die Registerkarte Statistik bietet Optionen f r die Anzeige von Tabellen mit den Modellierungsergebnissen Anpassungsma e Ljung Box Statistik und Anzahl von Ausrei ern nach Modell anzeigen Aktivieren Sie diese Option um f r jedes gesch tzte Modell eine Tabelle mit den ausgew hlten Anpassungsma e Ljung Box Werten und der Anzahl von Ausrei ern anzuzeigen Anpassungsma e Sie k nnen eine oder mehrere der folgenden Optionen f r die Aufnahme in die Tabelle ausw hlen die die Anpassungsma e f r die einzelnen gesch tzten Modelle enth lt R Quadrat f r station ren Teil R Quadrat Wurzel der mittleren Fehler Quadratsumme Mittlerer absoluter Fehler in Prozent Mittlerer absoluter Fehler Maximaler absoluter Fehler in Prozent
139. pezialfall des Holt Modells Exponentielles Gl tten mit dem Brown Modell weist sehr gro e hnlichkeit auf mit einem ARIMA Modell mit Autoregression der Ordnung 0 Differenzenbildung der Ordnung 2 und gleitenden Durchschnitten der Ordnung 2 dabei ist bei den gleitenden Durchschnitten der Koeffizient f r den Abstand 2 gleich dem Quadrat der H lfte des Koeffizienten f r den Abstand 1 Ged mpfter Trend Dieses Modell eignet sich f r Zeitreihen mit einem sich abschw chenden linearen Trend aber ohne Saisonalit t Seine Gl ttungsparameter betreffen Niveau Trend und die D mpfung des Trends Exponentielles Gl tten mit ged mpftem Trend weist eine sehr gro e hnlichkeit auf mit einem ARIMA Modell mit Autoregression der Ordnung 1 Differenzenbildung der Ordnung 1 und gleitenden Durchschnitten der Ordnung 2 m Einfach saisonal Dieses Modell eignet sich f r Zeitreihen ohne Trend aber mit einem saisonalen Effekt der ber die Zeit gleich bleibt Seine Gl ttungsparameter betreffen Niveau und Saison Einfaches saisonales exponentielles Gl tten weist sehr gro e hnlichkeit auf mit einem ARIMA Modell mit Autoregression der Ordnung 0 Differenzenbildung der Ordnung 1 saisonaler Differenzenbildung der Ordnung 1 und gleitenden Durchschnitten der Ordnung 1 p und p 1 wobei p die Anzahl der Perioden im Saisonintervall ist bei monatlichen Daten ist p 12 m Winters additiv Dieses Modell eignet sich f r Zeitreihen mit einem linearen Trend und ei
140. r den Zeitraum von 10 Jahren gesammelt Diese Informationen finden Sie in der Datei catalog sav F r weitere Informationen siehe Beispieldateien in Anhang D auf S 108 Zur Durchf hrung einer Trendanalyse m ssen alle m glicherweise in den Daten vorhandenen saisonalen Variationen entfernt werden Dies l sst sich mit der Prozedur Saisonale Zerlegung problemlos erreichen Bestimmen und Festlegen der Periodizit t F r die Prozedur Saisonale Zerlegung muss die Arbeitsdatei eine periodische Datumskomponente enthalten beispielsweise eine j hrliche Periodizit t von 12 Monaten eine w chentliche Periodizit t von 7 Tagen usw Sie sollten zun chst die Zeitreihe grafisch darstellen da die Untersuchung eines Zeitreihendiagramms oft zu einer brauchbaren Vermutung ber die zugrunde liegende Periodizit t f hrt So erhalten Sie ein Diagramm f r den Absatz an Herrenbekleidung im Verlauf der Zeit W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Zeitreihen Sequenzdiagramme 88 89 Abbildung 10 1 Dialogfeld Sequenzdiagramme 8 Sales of Women s Clothing wo Sales of Jewelry jewel 8E Number of Catalogs Mailed mail 8 Number of Pages in Catalog pa 2 Number of Phone Lines Open fo E Amount Spent on Print Advertisi 8 Number of Customer Service Re C Ein Diagramm je Variable Sequenzdiagramme X Variablen ej Zeitachsenbeschriftung gt B Dat
141. r Arbeitsdatei Das Ende der Vorhersageperiode kann auf der Registerkarte Optionen festgelegt werden Angeben von Optionen f r den Expert Modeler Der Expert Modeler bietet Optionen mit denen die Gruppe m glicher Modelle eingeschr nkt die Behandlung von Ausrei ern angegeben und Ereignisvariablen angegeben werden k nnen Modellauswahl und Ereignisspezifikation Abbildung 2 2 Dialogfeld Kriterien f r Expert Modeler Registerkarte Modell Zeitreihenmodellierung Kriterien f r Expert Modeler Modell AusreiBer Modelltyp Alle Modelle Nur Modelle mit exponentiellem Glatten Nur ARIMA Modelle Aktuelle Periodizit t 12 Typ Variable Ereignisvariablen sind spezielle unabh ngige Yariablen zum Modellieren von Auswirkungen externer Ereignisse wie Hochwasser Streiks oder der Einf hrung einer neuen Produktlinie berpr fen Sie alle Variablen die als Ereignisvariablen behandelt werden sollen Bei jeder mu 1 einen Zeitpunkt angeben an dem ein Ereignis vermutlich Auswirkungen zeigt Auf der Registerkarte Modell k nnen Sie die Modelltypen die vom Expert Modeler ber cksichtigt werden sollen und Ereignisvariablen angeben Modelltyp Die folgenden Optionen sind verf gbar Alle Modelle Der Expert Modeler ber cksichtigt sowohl ARIMA Modelle als auch Modelle mit exponentiellem Gl tten m Nur Modelle mit exponentiellem Gl tten Der Expert Modeler ber cksichtigt nur Modelle mit exponentiell
142. ramms handelt Die Gl ttung bietet ein Mittel zur Beseitigung des Hintergrundrauschens aus einem Periodogramm wodurch die zugrunde liegende Struktur besser isoliert werden kann Die Spektraldichte besteht aus f nf unterschiedlichen Spitzen die in gleichen Abst nden erscheinen Die Spitze mit der niedrigsten Frequenz entspricht einfach der gegl tteten Version der Spitze bei 0 08333 Um die Bedeutung der vier Spitzen bei h heren Frequenzen zu verstehen m ssen Sie bedenken dass das Periodogramm berechnet wurde indem die Zeitreihen als Summe aus Kosinus und Sinusfunktion modelliert wurde Periodische Komponenten die die Gestalt einer Sinus oder Kosinusfunktion haben sinusf rmig erscheinen im Periodogramm als einzelne Spitzen Periodische Komponenten die nicht sinusf rmig sind erscheinen als Reihen von Spitzen mit verschiedenen H hen im gleichen Abstand wobei die Spitze mit der niedrigsten Frequenz in der Reihe bei der Frequenz der periodischen Komponente auftritt Daher weisen die vier Spitzen bei h heren Frequenzen in der Spektraldichte lediglich darauf hin dass die j hrliche periodische Komponente nicht sinusf rmig ist Sie haben nun alle erkennbaren Strukturen im Spektraldichtediagramm erkl rt und schlie en daraus dass die Daten eine einzelne periodische Komponente mit einer Periode von 12 Monaten enthalten 100 Kapitel 11 Zusammenfassung Mit der Prozedur Spektraldiagramme haben Sie die Existenz einer j hrlic
143. rden marketvalues sav Diese Datendatei betrifft Hausverk ufe in einem Neubaugebiet in Algonquin Illinois in den Jahren 1999 2000 Diese Verk ufe sind in Grundbucheintr gen dokumentiert mutualfund sav Diese Datendatei betrifft Aktienmarktdaten f r verschiedene Technologieaktien die in im Index S amp P 500 verzeichnet sind Jeder Fall entspricht einem Unternehmen nhis2000_subset sav Die National Health Interview Survey NHIS ist eine gro e bev lkerungsbezogene Umfrage in unter der US amerikanischen Zivilbev lkerung Es werden pers nliche Interviews in einer landesweit repr sentativen Stichprobe von Haushalten durchgef hrt F r die Mitglieder jedes Haushalts werden demografische Informationen und Beobachtungen zum Gesundheitsverhalten und Gesundheitsstatus eingeholt Diese Datendatei enth lt eine Teilmenge der Informationen aus der Umfrage des Jahres 2000 National Center for Health Statistics National Health Interview Survey 2000 Datendatei und Dokumentation ffentlich zug nglich ftp ftp cdc gov pub Health_Statistics NCHS Datasets NHIS 2000 Zugriff erfolgte 2003 ozone sav Die Daten enthalten 330 Beobachtungen zu sechs meteorologischen Variablen zur Vorhersage der Ozonkonzentration aus den brigen Variablen Bei fr heren Untersuchungen Breiman als auch Friedman 1985 Hastie als auch Tibshirani 1990 fanden Wissenschaftler einige Nichtlinearit ten unter diesen Variablen die die Standardverfahren bei der
144. rozedur Zeitreihenmodellierung mit dem Unterbefehl MODEL Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel 3 Zeitreihenmodell zuweisen Mit der Prozedur Zeitreihenmodell zuweisen werden vorhandene Zeitreihenmodelle aus einer externen Datei geladen und auf die Arbeitsdatei angewendet Mit dieser Prozedur k nnen Sie Vorhersagen f r Zeitreihen berechnen f r die neue oder berarbeitete Daten verf gbar sind ohne die Modelle erneut zu erstellen Modelle werden mit der Prozedur Zeitreihenmodellierung erzeugt Beispiel Sie arbeiten als Bestandsmanager f r einen Gro handel und sind f r 5 000 Produkte zust ndig Mit dem Expert Modeler haben Sie Modelle erstellt die den Absatz der einzelnen Produkte innerhalb der n chsten drei Monate vorhersagen Das Data Warehouse wird jeden Monat mit den neuen Verkaufsdaten aktualisiert mit denen Sie Ihre Vorhersagen monatlich aktualisieren m chten Verwenden Sie hierf r die Prozedur Zeitreihenmodell zuweisen bei der Sie die urspr nglichen Modellen beibehalten k nnen und lediglich die Modellparameter neu sch tzen m ssen um die neuen Daten zu ber cksichtigen Statistiken Ma e f r die Anpassungsg te R Quadrat f r station ren Teil R Quadrat R2 Wurzel der mittleren Fehler Quadratsumme RMSE mittlerer absoluter Fehler MAE mittlerer absoluter Fehler in Prozent MAPE maximaler absoluter Fehler MaxAE maximaler absoluter
145. rsageperiode Anpassungswerte Die vom Modell vorhergesagten Werte f r die Sch tzperiode Konfidenzintervalle f r Vorhersagen Die Konfidenzintervalle f r die Vorhersageperiode Konfidenzintervalle f r Anpassungswerte Die Konfidenzintervalle f r die Sch tzperiode Residuen Autokorrelationsfunktion ACF Zeigt f r jedes gesch tzte Modell ein Diagramm der Residuen Autokorrelationen an Part Residuen Autokorrelationsfunktion PACF Zeigt f r jedes gesch tzte Modell ein Diagramm der partiellen Residuen Autokorrelationen an 21 Zeitreihenmodellierung Einschr nken der Ausgabe auf die am besten schlechtesten angepassten Modelle Abbildung 2 10 Zeitreihenmodellierung Registerkarte Ausgabefilter EM Zeitreihenmodellierung Variablen Statistik Diagramme Susgabefilter Speichern Optionen Modelle nach G te der Anpassung filtern Anzeigen Die Registerkarte Ausgabefilter enth lt Optionen mit denen sowohl Tabellen als auch Diagrammausgabe auf eine Untergruppe von gesch tzten Modellen beschr nkt werden kann Sie k nnen die Ausgabe mithilfe von Anpassungskriterien auf die am besten und oder am schlechtesten angepassten Modelle beschr nken In der Standardeinstellung sind alle gesch tzten Modelle in der Ausgabe enthalten Am besten angepa te Modelle Aktivieren Sie diese Option um die am besten angepassten Modelle in die Ausgabe einzuschlie en W hlen Sie ein Ma f r Anpassungsg te un
146. sagen f r die Sch tzperiode Januar 1999 bis Dezember 2003 Damit bekommen Sie einen Einblick wie gut das Modell an die bekannten Werte angepasst ist Abbildung 6 12 Vorhersagetabelle Modell JAN 2004 FEB 2004 M r 2004 Subscribers for Vorhersagen 11447 11390 Market 1 Model_1 UCL 11767 11870 LCL 11126 10910 Subscribers for Vorhersagen 55856 56704 Market 2 Model_2 UCL 57195 58575 LCL 54518 54832 Subscribers for Vorhersagen 59656 59305 58954 Market 3 Model_3 UCL 60457 60753 61158 LCL 58856 57857 56750 Subscribers for Vorhersagen 18235 18424 18628 Market 4 Model_4 UCL 18413 18731 19121 LCL 18058 18116 18136 Sie k nnen auch eine Tabelle mit den vorhergesagten Werten erstellen Die Tabelle besteht aus den vorhergesagten Werten in der Sch tzperiode enth lt jedoch im Gegensatz zu den neuen Variablen mit den Modellvorhersagen keine vorhergesagten Werte in der Sch tzperiode Die Ergebnisse sind nach Modellen geordnet und mit dem Modellnamen beschriftet Dieser besteht aus dem Namen oder Label der verkn pften abh ngigen Variablen gefolgt von einem Modellbezeichner genauso wie die Namen der neue Variablen die die Modellvorhersagen enthalten Die Tabelle enth lt auch die oberen Konfidenzgrenzen UCL und die unteren Konfidenzgrenzen LCL f r die vorhergesagten Werte 95 in der Standardeinstellung Sie k nnen zwischen zwei Ans tzen f r die Berechnung der vorhergesagten Werte ausw hlen Speichern d
147. se 8 Expert Modeler 7 49 66 exponentielles Gl tten 7 10 Fehlende Werte 24 Konfidenzintervalle 19 24 Modellbeschreibung Tabelle 74 Modellnamen 24 Modellparameter 17 72 Modellspezifikationen als XML speichern 22 54 71 Modellstatistik Tabelle 75 neue Variablennamen 22 58 Partielle Residuen Autokorrelationsfunktion 17 19 Periodizit t 8 10 12 14 Residuen Autokorrelationsfunktion 17 19 Sch tzperiode 7 52 Statistik f r alle Modelle 17 19 55 57 Statistik f r Anpassungsg te 17 19 55 75 bertragungsfunktionen 14 Vorhersagen 17 19 55 Vorhersagen speichern 22 54 Vorhersageperiode 7 24 52 53 Vorhersagetabelle 59 Zeitreihentransformation 10 12 14
148. sentlich st rkerer Interaktion primary groups Prim rgruppen vertraulich secondary groups Sekund rgruppen freiwillig und modern community die moderne Gesellschaft ein lockerer Zusammenschluss der aus einer engen physischen N he und dem Bedarf an spezialisierten Dienstleistungen entsteht healthplans sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Versicherungsgruppe geht vier verschiedene Pl ne zur Gesundheitsvorsorge f r Kleinbetriebe zu evaluieren Zw lf Inhaber von Kleinbetrieben Arbeitgeber wurden gebeten die Pl ne danach in eine Rangfolge zu bringen wie gern sie sie ihren Mitarbeitern anbieten w rden Jeder Fall entspricht einem Arbeitgeber und enth lt die Reaktionen auf die einzelnen Pl ne health_funding sav Hierbei handelt es sich um eine hypothetische Datei die Daten zur Finanzierung des Gesundheitswesens Betrag pro 100 Personen Krankheitsraten Rate pro 10 000 Personen der Bev lkerung und Besuche bei medizinischen Einrichtungen rzten Rate pro 10 000 Personen der Bev lkerung enth lt Jeder Fall entspricht einer anderen Stadt hivassay sav Hierbei handelt es sich um eine hypothetische Datendatei zu den Bem hungen eines pharmazeutischen Labors einen Schnelltest zur Erkennung von HIV Infektionen zu entwickeln Die Ergebnisse des Tests sind acht kr ftiger werdende Rotschattierungen wobei kr ftigeren Schattierungen auf eine h here I
149. skomponenten entsprechen im Prinzip ihren nichtsaisonalen Gegenst cken Bei saisonalen Ordnungen werden die Werte der aktuellen Zeitreihe jedoch von Werten zur ckliegender Zeitreihen beeinflusst die um eine oder mehrere saisonalen Perioden getrennt sind Bei monatlichen Daten saisonale Periode von 12 beispielsweise bedeutet eine saisonale Ordnung von 1 dass der Wert der aktuellen Zeitreihe durch den Zeitreihenwert beeinflusst wird der 12 Perioden vor dem aktuellen liegt Eine saisonale Ordnung von 1 entspricht bei monatlichen Daten einer nichtsaisonalen Ordnung von 12 Aktuelle Periodizit t Gibt die gegenw rtig f r die Arbeitsdatei definierte Periodizit t an sofern vorhanden Die aktuelle Periodizit t wird als Ganzzahl angegeben z B 12 f r eine j hrliche Periodizit t wobei jeder Fall einen Monat darstellt Wenn keine Periodizit t angegeben wurde wird der Wert Keine angezeigt F r saisonales Modelle muss eine Periodizit t angegeben werden Die Periodizit t wird im Dialogfeld Datum definieren angegeben Verz gerung Wenn eine Verz gerung festgelegt wird verz gert sich der Einfluss der unabh ngigen Variable um die Anzahl der angegebenen Intervalle Bei einer Verz gerung mit dem Wert 5 beeinflusst der Wert der unabh ngigen Variable zum Zeitpunkt die Vorhersagen erst nach dem Ablauf von f nf Perioden t 5 Transformation Die Angabe einer bertragungsfunktion f r ein Set von unabh ngigen Variablen enth lt au
150. sw hlen die Option Nach Zeit oder Fallbereich ausw hlen Dieses Beispiel bezieht sich auf die Standardeinstellung Beachten Sie auch dass die Standard Vorhersageperiode nach dem Ende der Sch tzperiode beginnt und sich bis zum letzten Fall in der Arbeitsdatei erstreckt Wenn die Vorhersage ber den letzten Fall hinausgehen soll m ssen Sie die Vorhersageperiode ausweiten Sie k nnen diese Einstellung auf der Registerkarte Optionen vornehmen wie sp ter in diesem Beispiel erl utert wird Klicken Sie auf Kriterien Abbildung 6 4 Dialogfeld Kriterien f r Expert Modeler Registerkarte Modell Zeitreihenmodellierung Kriterien f r Expert Modeler Modell AusreiBer Modelltyp Alle Modelle O Nur Modelle mit exponentiellem Glatten O Nur ARIMA Modelle Exp Aktuelle Periodizit t 12 Ereignisse Unabh ngige Variablen Erei Typ Variable Ereignisvariablen sind spezielle unabh ngige Yariablen zum Modellieren von Auswirkungen externer Ereignisse wie Hochwasser Streiks oder der Einf hrung einer neuen Produktlinie berpr fen Sie alle Variablen die als Ereignisvariablen behandelt werden sollen Bei jeder mu 1 einen Zeitpunkt angeben an dem ein Ereignis vermutlich Auswirkungen zeigt Deaktivieren Sie im Gruppenfeld Modelltyp die Option Expert Modeler ber cksichtigt saisonale Modelle Wenngleich die Daten monatlich erhoben werden und die aktuelle Periodizit t 12 betr gt konnte
151. t Wenn die neuen Variablen gespeichert werden sollen aktivieren Sie jeweils das zugeh rige Kontrollk stchen Speichern In der Standardeinstellung werden keine neuen Variablen gespeichert m Vorhergesagte Werte Die vom Modell vorhergesagten Werte m Untere Konfidenzgrenzen Die unteren Konfidenzgrenzen f r die vorhergesagten Werte m Obere Konfidenzgrenzen Die oberen Konfidenzgrenzen f r die vorhergesagten Werte 38 Kapitel 3 m Residuum Rauschen Die Modellresiduen Bei der Transformation von abh ngigen Variablen z B mit nat rlichem Logarithmus sind dies die Residuen f r die transformierte Reihe Diese Option ist nur verf gbar wenn die Modellparameter erneut gesch tzt werden Erneut aus den Daten sch tzen auf der Registerkarte Modelle m Pr fix f r Variablennamen Geben Sie Pr fixe f r die Namen der neuen Variablen an oder bernehmen Sie die Standardpr fixe Variablennamen bestehen aus dem Pr fix dem Namen der zugewiesenen abh ngigen Variablen und einem Modellbezeichner Beim Auftreten von Namenskonflikten wird der Variablenname ggf erweitert Das Pr fix muss den Regeln f r g ltige Variablennamen entsprechen Modelldatei mit erneut gesch tzten Parametern exportieren Modellspezifikationen mit erneut gesch tzten Parametern und Statistiken f r Anpassungsg te werden in die angegebene XML Datei exportiert Diese Option ist nur verf gbar wenn die Modellparameter erneut gesch tzt werden Erneut a
152. t WinWrap Basic Copyright 1993 2007 Polar Engineering and Consulting http www winwrap com SPSS Trends 16 0 Copyright 2007 SPSS Inc Alle Rechte vorbehalten Ohne schriftliche Erlaubnis der SPSS GmbH Software darf kein Teil dieses Handbuchs fiir irgendwelche Zwecke oder in irgendeiner Form mit irgendwelchen Mitteln elektronisch oder mechanisch mittels Fotokopie durch Aufzeichnung oder durch andere Informationsspeicherungssysteme reproduziert werden 1234567890 1009 08 07 Vorwort SPSS 16 0 ist ein umfassendes System zum Analysieren von Daten Das optionale Erweiterungsmodul SPSS Trends bietet die zus tzlichen Analyseverfahren die in diesem Handbuch beschrieben sind Die Prozeduren im Erweiterungsmodul Trends m ssen zusammen mit SPSS 16 0 Base verwendet werden Sie sind vollst ndig in dieses System integriert Installation Zur Installation von SPSS Trends Erweiterungsmodul f hren Sie den Lizenzautorisierungsassistenten mit dem Autorisierungscode aus den Sie von SPSS erhalten haben Weitere Informationen finden Sie in den Installationsanweisungen im Lieferumfang von SPSS Trends Erweiterungsmodul Kompatibilit t SPSS kann auf vielen Computersystemen ausgef hrt werden Mindestanforderungen an das System und Empfehlungen finden Sie in den Unterlagen die mit Ihrem System geliefert werden Seriennummern Die Seriennummer des Programms dient gleichzeitig als Identifikationsnummer bei SPSS Sie ben tigen diese Seri
153. t besitzt Beachten Sie wie genau die saisonalen Spitzen im Modell vorhergesagt werden Der Aufw rtstrend der Daten wird ebenfalls angemessen erfasst Tabelle der Modellbeschreibung Abbildung 8 9 Tabelle der Modellbeschreibung Model ID Sales of Men s Clothing Modell_1 ARIMACO 0 0 0 1 0 Die Tabelle der Modellbeschreibung enth lt einen Eintrag f r jedes gesch tzte Modell mit Modellbezeichner und Modelltyp Der Modellbezeichner umfasst den Namen oder das Label der zugeordneten abh ngigen Variablen sowie einen vom System zugewiesenen Namen Im vorliegenden Beispiel ist die abh ngige Variable Sales of Men s Clothing und der vom System zugewiesene Name lautet Modell_1 Die Zeitreihenmodellierung unterst tzt sowohl Modelle mit exponentiellem Gl tten als auch ARIMA Modelle Die Modelltypen mit exponentiellem Gl tten werden nach den allgemein verwendeten Namen aufgef hrt z B Holt oder Winters additiv ARIMA Modelltypen werden nach der Standardnotation f r ARIMA aufgef hrt p d q P D Q wobei p die Ordnung 75 Ermitteln von signifikanten Einflussvariablen mit dem Expert Modeler der Autoregression d die Ordnung der Differenzbildung oder Integration und g die Ordnung des gleitenden Durchschnitts ist und P D Q deren saisonalen Entsprechungen darstellen Der Expert Modeler hat ermittelt dass der Verkauf von Herrenbekleidung am besten durch ein saisonales ARIMA Modell mit Differenzbildung erster Ordnung
154. te eine Modelldatei beispielsweise Modelle f r Zeitreihen enthalten die Verkaufsst ckzahlen repr sentieren und eine andere Modelle f r Zeitreihen die f r Verkaufserl se stehen Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel Saisonale Zerlegung Die Prozedur Saisonale Zerlegung zerlegt eine Zeitreihe in eine saisonale Komponente eine kombinierte Trend und Zykluskomponente sowie eine Fehler Komponente Die Prozedur ist eine Umsetzung der Census I Methode die auch als Verh ltnis zum gleitenden Durchschnitt bekannt ist Beispiel Ein Wissenschaftler interessiert sich f r die Analyse monatlicher Messungen des Ozongehalts an einer bestimmten Wetterstation Ziel ist es herauszufinden ob bei den Daten ein Trend vorliegt Um einen etwaigen wirklichen Trend aufzudecken muss der Wissenschaftler zun chst die Schwankungen in den Messergebnissen ber cksichtigen die auf saisonale Effekte zur ckzuf hren sind Mit der Prozedur Saisonale Zerlegung k nnen etwaige systematische saisonale Schwankungen entfernt werden Die Trendanalyse wird dann auf eine saisonbereinigte Zeitreihe angewendet Statistiken Die Gruppe der saisonalen Faktoren Daten Die Variablen m ssen numerisch sein Annahmen Die Variablen d rfen keine eingebetteten fehlenden Daten enthalten Es muss mindestens eine periodische Datumskomponente definiert sein Sch tzen von saisonalen Faktoren W
155. te vorhergesagte Fehler ausgedr ckt in Prozent Dieses Ma hilft dabei sich ein Worst Case Szenario f r die Vorhersagen vorzustellen MaxAE Maximaler absoluter Fehler Maximum Absolute Error also maximaler Betrag des Fehlers Dies ist der gr te vorhergesagte Fehler ausgedr ckt in derselben Ma einheit wie die abh ngige Zeitreihe Genau wie MaxAPE hilft er dabei sich ein Worst Case Szenario f r die Vorhersagen vorzustellen Der maximale absolute Fehler und der maximale absolute Fehler in Prozent k nnen an verschiedenen Punkten in der Zeitreihe auftreten beispielsweise wenn der absolute Fehler f r einen gro en Zeitreihenwert geringf gig gr er ist als der absolute Fehler f r einen kleinen Zeitreihenwert In diesem Fall tritt der maximale absolute 101 102 Anhang A Fehler beim gr eren Zeitreihenwert und der maximale absolute Fehler in Prozent beim kleineren Zeitreihenwert auf m Normalisiertes BIC Normalisiertes Bayes Informationskriterium BIC Ein allgemeines Ma der insgesamt erreichten G te der Anpassung das auch die Komplexit t des Modells zu ber cksichtigen versucht Es ist ein Wert der auf dem mittleren quadratischen Fehler beruht und eine Penalisierung f r die Anzahl der Modellparameter und die L nge der Zeitreihe enth lt Die Penalisierung neutralisiert die berlegenheit von Modellen mit einer gr eren Anzahl von Parametern und macht die Statistik damit gut vergleichbar f r verschiedene Modelle
156. ter Fall Yorhersageperiode O Erster Fall nach der Sch tzperiode bis letzter Fall in der Arbeitsdatei Erster Fall nach der Sch tzperiode bis zum angegebenen Datum Datum G Jahr Monat 2004 6 29 Zeitreihenmodell zuweisen gt Geben Sie die Angaben f r eine Modelldatei ein oder klicken Sie auf Durchsuchen und w hlen Sie eine Modelldatei aus Modelldateien werden mit der Prozedur Zeitreihenmodellierung erstellt Die folgenden Optionen sind verf gbar m Erneutes Sch tzen der Modellparameter mithilfe der Daten in der Arbeitsdatei Vorhersagen werden anhand der erneut gesch tzten Parameter erstellt m Speichern von Vorhersagen Konfidenzintervallen und Residuum Rauschen m Speichern des erneut gesch tzten Modells im XML Format Modellparameter und Ma e f r die Anpassungsg te Laden aus der Modelldatei Vorhersagen werden mithilfe der Modellparameter aus der Modelldatei erstellt wobei die Parameter nicht erneut gesch tzt werden Die Ma e f r die Anpassungsg te die in der Ausgabe angezeigt und zum Filtern von Modellen am besten schlechtesten angepasste Modelle verwendet werden werden aus der Modelldatei abgerufen und entsprechen den Daten die bei der Entwicklung oder letzten Aktualisierung des jeweiligen Modells verwendet wurden Bei dieser Option werden bei Vorhersagen keine historischen Daten f r entweder abh ngige oder unabh ngige Variablen in der Arbeitsdatei ber cksichtigt W hlen Sie Erne
157. tere Exemplare von Produkthandb chern k nnen direkt bei SPSS Inc bestellt werden Besuchen Sie den SPSS Web Store unter http www spss com estore oder wenden Sie sich an Ihr regionales SPSS B ro das Sie auf der SPSS Website unter http www spss com worldwide finden Wenden Sie sich bei telefonischen Bestellungen in den USA und Kanada unter 800 543 2185 direkt an SPSS Inc Wenden Sie sich bei telefonischen Bestellungen au erhalb von Nordamerika an Ihr regionales SPSS B ro das Sie auf der SPPS Website finden Das Handbuch SPSS Statistical Procedures Companion von Maria NoruSis wurde von Prentice Hall ver ffentlicht Eine neue Fassung dieses Buchs mit Aktualisierungen f r SPSS 16 0 ist geplant Das Handbuch SPSS Advanced Statistical Procedures Companion bei dem auch SPSS 16 0 ber cksichtigt wird erscheint demn chst Das Handbuch SPSS Guide to Data Analysis f r SPSS 16 0 wird ebenfalls derzeit erstellt Ank ndigungen f r Ver ffentlichungen die ausschlie lich ber Prentice Hall verf gbar sind finden Sie auf der SPSS Website unter http www spss com estore w hlen Sie Ihr Land aus und klicken Sie auf Books Kundenmeinungen Ihre Meinung ist uns wichtig Teilen Sie uns bitte Ihre Erfahrungen mit SPSS Produkten mit Insbesondere haben wir Interesse an neuen interessanten Anwendungsgebieten von SPSS Trends Erweiterungsmodul Senden Sie uns eine E Mail an suggest spss com oder schreiben Sie an SPSS Inc Attn Director of Product Plann
158. tergrund und zur Servicenutzung telco_extra sav Diese Datendatei hnelt der Datei telco sav allerdings wurden die Variablen tenure und die Log transformierten Variablen zu den Kundenausgaben entfernt und durch standardisierte Log transformierte Variablen ersetzt telco_missing sav Diese Datendatei entspricht der Datei telco_mva_complete sav allerdings wurde ein Teil der Daten durch fehlende Werte ersetzt telco_mva_complete sav Bei dieser Datendatei handelt es sich um eine Teilmenge der Datendatei telco sav allerdings mit anderen Variablennamen testmarket sav Diese hypothetische Datendatei bezieht sich auf die Pl ne einer Fast Food Kette einen neuen Artikel in ihr Men aufzunehmen Es gibt drei m gliche Kampagnen zur Verkaufsf rderung f r das neue Produkt Daher wird der neue Artikel in Filialen in mehreren zuf llig ausgew hlten M rkten eingef hrt An jedem Standort wird eine andere Form der Verkaufsf rderung verwendet und die w chentlichen Verkaufszahlen f r das neue Produkt werden f r die ersten vier Wochen aufgezeichnet Jeder Fall entspricht einer Standort Woche testmarket_1month sav Bei dieser hypothetischen Datendatei handelt es sich um die Datendatei testmarket sav wobei die w chentlichen Verkaufszahlen zusammengefasst sind sodass jeder Fall einem Standort entspricht Dadurch entfallen einige der Variablen die w chentlichen nderungen unterworfen waren und die verzeichneten Verkaufszahlen sind nun die
159. tion der bevorzugten Politiker vor und nach der Debatte demo sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Kundendatenbank geht die zum Zwecke der Zusendung monatlicher Angebote erworben wurde Neben verschiedenen demografischen Informationen ist erfasst ob der Kunde auf das Angebot geantwortet hat 112 Anhang D demo_cs_1 sav Hierbei handelt es sich um eine hypothetische Datendatei f r den ersten Schritt eines Unternehmens das eine Datenbank mit Umfrageinformationen zusammenstellen m chte Jeder Fall entspricht einer anderen Stadt Au erdem sind IDs f r Region Provinz Landkreis und Stadt erfasst demo_cs_2 sav Hierbei handelt es sich um eine hypothetische Datendatei f r den zweiten Schritt eines Unternehmens das eine Datenbank mit Umfrageinformationen zusammenstellen m chte Jeder Fall entspricht einem anderen Stadtteil aus den im ersten Schritt ausgew hlten St dten Au erdem sind IDs f r Region Provinz Landkreis Stadt Stadtteil und Wohneinheit erfasst Die Informationen zur Stichprobenziehung aus den ersten beiden Stufen des Stichprobenplans sind ebenfalls enthalten demo_cs sav Hierbei handelt es sich um eine hypothetische Datendatei die Umfrageinformationen enth lt die mit einem komplexen Stichprobenplan erfasst wurden Jeder Fall entspricht einer anderen Wohneinheit Es sind verschiedene Informationen zum demografischen Hintergrund und zur Stichprobenziehung erfasst diets
160. trag vorhanden ist Im Rahmen des Beispiels werden alle Variablen im Modell aufgef hrt einschlie lich der abh ngigen Variablen und allen unabh ngigen Variablen die vom Expert Modeler als signifikant eingestuft wurden Aus der Tabelle der Modellstatistik ist bereits bekannt dass zwei signifikante Einflussvariablen vorhanden sind Die Tabelle der Modellparameter zeigt dass es sich um Number of Catalogs Mailed und Number of Phone Lines Open for Ordering handelt Zusammenfassung Sie haben gelernt wie Sie mit dem Expert Modeler ein Modell erstellen und signifikante Einflussvariablen ermitteln und Sie haben das resultierende Modell als externe Datei gespeichert Sie k nnen jetzt mit der Prozedur Zeitreihenmodell zuweisen alternative Szenarien f r die Pr diktorzeitreihe untersuchen und bewerten wie sich die Alternativen auf die Absatzvorhersagen auswirken Kapitel Untersuchen von Einflussvariablen durch das Zuweisen gespeicherter Modelle Sie haben mit der Zeitreihenmodellierung ein Modell Ihrer Daten erstellt und die f r Vorhersagen geeigneten Einflussvariablen identifiziert Die Einflussvariablen stellen Faktoren dar die Sie beeinflussen k nnen Daher m chten Sie unterschiedliche Werte f r diese Variablen in der Vorhersageperiode untersuchen um deren Einfluss auf die abh ngige Variable zu ermitteln Diese Aufgabe kann problemlos mit der Prozedur Zeitreihenmodell zuweisen durchgef hrt werden indem Sie die in der
161. treihe werden nur Werte f r Januar 1999 bis M rz 1999 ben tigt also die F lle 121 bis 123 gt Kopieren Sie die Werte dieser drei F lle aus Vorhersagewert_mail_Modell_1 und h ngen Sie sie an die Variable mail an gt Wiederholen Sie diesen Vorgang f r Vorhersagewert_phone_Modell_2 wobei Sie die letzten drei F lle kopieren und an die Variable phone anh ngen Abbildung 9 5 ber die Vorhersageperiode hinaus erweiterte Pr diktorzeitreihe 1999 1999 1999 Variablenansicht Die Einflussvariablen wurden nun tiber die Vorhersageperiode hinaus erweitert Andern der Werte von Einflussvariablen in der Vorhersageperiode Zum Testen der beiden Szenarien Versenden zus tzlicher Kataloge oder Bereitstellen zus tzlicher Telefonleitungen m ssen die Sch tzwerte f r die Einflussvariablen mail oder phone ge ndert werden Da hier nur die Einflussvariablen f r drei F lle Monate ge ndert werden k nnten die neue Werte einfach direkt in den entsprechenden Zellen im Daten Editor eingegeben werden Um das entsprechende Verfahren zu erl utern wird jedoch das Dialogfeld Variable berechnen verwendet Wenn viele Werte zu ndern sind ist das Dialogfeld Variable berechnen meist vorzuziehen W hlen Sie die folgenden Befehle aus den Men s aus Transformieren Variable berechnen 82 Kapitel 9 Abbildung 9 6 Dialogfeld Variable berechnen E Variable berechnen Zielvariable Numerisch
162. tudy sav Diese hypothetische Datendatei enth lt die Ergebnisse einer Studie der Stillman Di t Rickman Mitchell Dingman als auch Dalen 1974 Jeder Fall entspricht einem Teilnehmer und enth lt dessen Gewicht vor und nach der Di t in amerikanischen Pfund sowie mehrere Messungen des Triglyceridspiegels in mg 100 ml dischargedata sav Hierbei handelt es sich um eine Datendatei zum Thema Seasonal Patterns of Winnipeg Hospital Use Menec Roos Nowicki MacWilliam Finlayson als auch Black 1999 Saisonale Muster der Belegung im Krankenhaus von Winnipeg vom Manitoba Centre for Health Policy dvdplayer sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Entwicklung eines neuen DVD Spielers geht Mithilfe eines Prototyps hat das Marketing Team Zielgruppendaten erfasst Jeder Fall entspricht einem befragten Benutzer und enth lt demografische Daten zu dem Benutzer sowie dessen Antworten auf Fragen zum Prototyp flying sav Diese Datendatei enth lt die Flugmeilen zwischen zehn St dten in den USA german_credit sav Diese Daten sind aus dem Daten Set German credit im Repository of Machine Learning Databases Blake als auch Merz 1998 an der Universit t von Kalifornien in Irvine entnommen grocery_1month sav Bei dieser hypothetischen Datendatei handelt es sich um die Datendatei grocery_coupons sav wobei die w chentlichen Eink ufe zusammengefasst sind sodass jeder Fall einem anderen Kunden e
163. tze bei Lag 1 mit einem langen exponentiellen Schwanz ein typisches Muster f r Zeitreihen Die signifikante Spitze bei Lag 12 deutet auf das Vorhandensein einer j hrlichen saisonalen Komponente in den Daten hin Die Untersuchung der partiellen Autokorrelationsfunktion erlaubt eine eindeutigere Schlussfolgerung Abbildung 10 5 Partielles Autokorrelationsdiagramm f r Herrenbekleidung 10 O Koeffizient obere Vertrauensgrenze _ Untere Vertrauensgrenze 0 5 wi Oo lt w 00 E 5 a 0 5 1 0 zels ee MAL g 7 Lag Number Die signifikante Spitze bei Lag 12 in der der partiellen Autokorrelationsfunktion best tigt das Vorhandensein einer j hrlichen saisonalen Komponente in den Daten 92 Kapitel 10 So legen Sie eine j hrliche Periodizit t fest W hlen Sie die folgenden Befehle aus den Men s aus Daten Datum definieren Abbildung 10 6 Dialogfeld Datum definieren Datum definieren F lle entsprechen Erster Fall Jahre Jahre Quartale Jahre Monate Jahre Quartale Monate Tage Wochen Tage Wochen Arbeitstage 5 Wochen Arbeitstage 6 Stunden Periodizit t auf h herer Ebene Jahr 1989 Monat 1 12 Tage Stunden Aktuelles Datum Keine x J Zur cksetzen Abbrechen J W hlen Sie Jahre Monate aus der Liste F lle entsprechen aus gt Geben Sie 1989 als Jahr und 1 als Monat ein Klicken Sie auf
164. us den Daten sch tzen auf der Registerkarte Modelle Optionen Abbildung 3 6 Zeitreihenmodell zuweisen Registerkarte Optionen E Zeitreihenmodell zuweisen Modelle Statistik Diagramme Ausgabefilter Speichern Optionen Benutzerdefinierte fehlende Werte Konfidenzintervallbreite als g ltig behandeln Auf der Registerkarte Optionen k nnen Sie die Behandlung fehlender Werte die Breite des Konfidenzintervalls und die f r die Autokorrelationen angezeigte Anzahl von Intervallen festlegen 39 Zeitreihenmodell zuweisen Benutzerdefinierte fehlende Werte Mit diesen Optionen wird die Behandlung benutzerdefinierter fehlender Werte gesteuert Als ung ltig behandeln Benutzerdefiniert fehlende Werte werden wie systemdefiniert fehlende Werte behandelt m Als g ltig behandeln Benutzerdefinierte fehlende Werte werden als g ltige Werte behandelt Richtlinie f r fehlende Werte Die folgenden Regeln gelten f r die Behandlung fehlender Werte Sie gelten auch f r systemdefinierte fehlende Wert und als ung ltig behandelte benutzerdefinierte fehlende Werte m F lle mit fehlenden Werten einer abh ngigen Variablen die innerhalb der Sch tzperiode liegen werden in das Modell eingeschlossen Die genaue Behandlung des fehlenden Werts h ngt von der Sch tzmethode ab m Bei ARIMA Modellen wird eine Warnung ausgegeben wenn ein Pr diktor innerhalb der Sch tzperiode fehlende Werte aufweist Mode
165. ut aus den Daten sch tzen aus wenn historische Daten in die Vorhersage einbezogen werden sollen Dar ber hinaus werden bei Vorhersagen keine Werte der abh ngigen Zeitreihe in der Vorhersageperiode einbezogen Werte unabh ngiger Variablen werden hingegen ber cksichtigt Wenn Sie aktuellere Werte der abh ngigen Zeitreihe haben und diese in die Vorhersagen einbeziehen m chten m ssen Sie eine erneute Sch tzung vornehmen und die Sch tzperiode entsprechend korrigieren Erneut aus den Daten sch tzen Modellparameter werden mithilfe der Daten in der Arbeitsdatei erneut gesch tzt Eine erneute Sch tzung der Modellparameter wirkt sich nicht auf die Modellstruktur aus Ein ARIMA 1 0 1 Modell bleibt beispielsweise unver ndert die autoregressiven Parameter und die Parameter f r gleitenden Durchschnitt werden hingegen erneut gesch tzt Bei der erneuten Sch tzung werden keine neuen Ausrei er erkannt Ausrei er werden sofern vorhanden immer aus der Modelldatei abgerufen m Sch tzperiode Die Sch tzperiode gibt die Gruppe von F llen an anhand derer die Modellparameter erneut gesch tzt werden In der Standardeinstellung umfasst die Sch tzperiode s mtliche F lle in der Arbeitsdatei Sie k nnen die Sch tzperiode festlegen indem Sie im Dialogfeld F lle ausw hlen die Option Nach Zeit oder Fallbereich ausw hlen Die von der Prozedur verwendete Sch tzperiode kann je nach den verf gbaren Daten unterschiedliche Modelle verwenden und
166. utzerdefinierte ARIMA Modelle n nonna naaa 12 Modellspezifikation f r benutzerdefinierte ARIMA Modelle 0 00 e ae 12 bertragungsfunktionen in benutzerdefinierten ARIMA Modellen 14 Ausrei er in benutzerdefinierten ARIMA Modellen 000000 cece eee 16 Ausgabe ua aa aan ened a a E ea phar bnew aea Raia neds ee er 17 Statistiken und Vorhersagetabellen 0 00 0 c cece eee ee 17 Diagramme a ccc vice et a deena ten ced en de tw Se eae ee ee 19 Einschr nken der Ausgabe auf die am besten schlechtesten angepassten Modelle 21 Speichern von Modellvorhersagen und Modellspezifikationen 0220000 eee 22 Optionen irsi tat paged te lence te Dh aad oe hd ee ede beh ee ae ne 24 Zus tzliche Funktionen beim Befehl TSMODEL 0 0000 cece ee eee eee 26 3 Zeitreihenmodell zuweisen 27 Ausgabe au r aaa ka ae laid ne ee na hen en he nen Daaa dunce 30 Statistiken und Vorhersagetabellen 00 00 cece eee eee eee 31 Diagramme heet 24 sargi iaa ann a oh eee ae bee had And oad oe Bald 33 Einschr nken der Ausgabe auf die am besten schlechtesten angepassten Modelle 35 Speichern von Modellvorhersagen und Modellspezifikationen 2 20000e eee 37 MD FEN TG Msaani fe FESTER hehe at neck ta et GER nae a etn LOAA aaa e Eaei a a a EGA ea i 38 Zus tzliche Funktionen beim Befehl TSAPPLY 0 00000 ccc eee ee eee ee 39 4 Saisonale Zer
167. utzerhandbuch Kapitel Einf hrung in Zeitreihen Eine Zeitreihe ist eine Reihe von Beobachtungen die gewonnen werden indem eine einzelne Variable regelm ig ber einen Zeitraum beobachtet wird In einer Zeitreihe mit Bestandsdaten beispielsweise k nnen die Beobachtungen t gliche Bestandsniveaus f r mehrere Monate repr sentieren Eine Zeitreihe die den Marktanteil eines Produkts anzeigt kann aus den w chentlichen Marktanteilen ber den Zeitraum einiger Jahre bestehen Eine Zeitreihe aus den Gesamtverkaufszahlen kann aus einer Beobachtung pro Monat ber den Zeitraum vieler Jahre bestehen Was alle diese Beispiele gemeinsam haben ist dass eine Variable ber einen bestimmten Zeitraum in regelm igen bekannten Intervallen beobachtet wurde Daher ist die Art der Daten f r eine typische Zeitreihe eine einzelne Sequenz oder Liste von Beobachtungen die in regelm igen Abst nden durchgef hrte Messungen repr sentieren Tabelle 1 1 Zeitreihe f r den t glichen Bestand Zeit Woche Tag Bestandsniveau ty 1 Montag 160 t2 1 Dienstag 135 t3 1 Mittwoch 129 t4 1 Donnerstag 122 t5 1 Freitag 108 t6 2 Montag 150 t60 12 Freitag 120 Eines der wichtigsten Ziele bei der Durchf hrung einer Zeitreihenanalyse ist der Versuch die zuk nftigen Werte der Zeitreihe vorherzusagen Ein Modell der Zeitreihe das die fr heren Werte erkl rte kann m glicherweise auch vorhersagen ob und wie stark die n chsten Werte zu bzw abnehmen Die F
168. von Modellen Gibt an dass Ergebnisse f r Modelle angezeigt werden deren Werte f r die Anpassungsg te f r alle gesch tzten Modelle in den untersten n Prozent liegen Ma f r Anpassungsg te W hlen Sie das Ma f r die Anpassungsg te anhand dessen die Modelle gefiltert werden sollen Der Standardwert ist R Quadrat f r den station ren Teil Speichern von Modellvorhersagen und Modellspezifikationen Abbildung 2 11 Zeitreihenmodellierung Registerkarte Speichern W Zeitreihenmodellierung Variablen Statistik Diagramme Ausgabefilter Speichern Optionen Variablen speichern Variablen Beschreibung Speichern Pr fix f r Variablennamen Vorhergesagte Werte Yorhersagewert Untere Konfidenzgrenzen O Obere Konfidenzgrenzen O Residuum Rauschen Fj F r jedes ausgew hlte Element wird je abh ngiger Yariablen eine Variable gespeichert Modelldatei exportieren 23 Zeitreihenmodellierung Auf der Registerkarte Speichern k nnen Sie festlegen dass Modellvorhersagen als neue Variablen in der Arbeitsdatei gespeichert werden sollen Au erdem k nnen die Modellspezifikationen in einer externen Datei im XML Format gespeichert werden Variablen speichern Sie k nnen Modellvorhersagen Konfidenzintervalle und Residuen als neue Variablen in der Arbeitsdatei speichern Jede abh ngige Zeitreihe erzeugt eine eigene Gruppe neuer Variablen und jede neue Variable enth lt Werte f r Sch tz und Vorhers
169. wohl nach Frequenz als auch nach Periode erstellt werden Es kann eine vollst ndige Auflistung jedes im Diagramm angezeigten Werts ausgegeben werden Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Teil II Beispiele Kapitel Prognosen f r gro e Datenmengen mit dem Expert Modeler Ein Analyst eines Breitband Providers soll eine Prognose ber die Vertragsabschl sse mit Kunden erstellen um die Nutzung der Bandbreite vorhersagen zu k nnen Es werden Prognosen f r alle 85 regionalen M rkte ben tigt die zusammen den gesamten Kundenstamm ergeben Die fr heren monatlichen Daten befinden sich in broadband _1 sav F r weitere Informationen siehe Beispieldateien in Anhang D auf S 108 In diesem Beispiel werden Sie den Expert Modeler verwenden um f r die kommenden drei Monaten f r jeden der 85 regionalen M rkte Prognosen anzufertigen wobei die erzeugten Modelle in einer externe XML Datei gespeichert werden Wenn Sie fertig sind empfiehlt es sich m glicherweise das n chste Beispiel Neuprognosen f r gro e Datenmengen durch das Zuweisen gespeicherter Modelle in Kapitel 7 auf S 60 durchzuarbeiten In diesem Beispiel werden die gespeicherten Modelle auf ein aktualisiertes Daten Set angewendet um die Prognosen auf drei weitere Monate auszuweiten ohne das Modell erneut zu erstellen Untersuchen der Daten Es empfiehlt sich grunds tzlich ein Gef hl f r die Natur der Daten zu entwickeln
170. zur G te der Anpassung Modellparameter Autokorrelationsfunktionen und Vorhersagen angezeigt werden k nnen Sofern die Modellparameter nicht erneut gesch tzt werden Erneut aus den Daten sch tzen auf der Registerkarte Modelle stammen die angezeigten Werte f r die Anpassungsma e Ljung Box Werte und Modellparameter aus der Modelldatei und entsprechen den Daten die bei der Entwicklung oder letzten Aktualisierung des jeweiligen Modells verwendet wurden Informationen zu Ausrei ern werden immer aus der Modelldatei abgerufen Anpassungsma e Ljung Box Statistik und Anzahl von Ausrei ern nach Modell anzeigen Aktivieren Sie diese Option um f r jedes Modell eine Tabelle mit den ausgew hlten Anpassungsma e Ljung Box Werten und der Anzahl von Ausrei ern anzuzeigen Anpassungsma e Sie k nnen eine oder mehrere der folgenden Optionen f r die Aufnahme in die Tabelle ausw hlen die die Anpassungsma e f r die einzelnen Modelle enth lt m R Quadrat f r station ren Teil m R Quadrat m Wurzel der mittleren Fehler Quadratsumme Mittlerer absoluter Fehler in Prozent 32 Kapitel 3 Mittlerer absoluter Fehler Maximaler absoluter Fehler in Prozent Maximaler absoluter Fehler Normalisiertes BIC F r weitere Informationen siehe Ma e f r die Anpassungsg te in Anhang A auf S 101 Statistik f r Modellvergleich Mit dieser Gruppe von Optionen wird die Anzeige der Tabellen gesteuert die die Statistiken f r alle Mode

Download Pdf Manuals

image

Related Search

Related Contents

Voir toutes les actions d`éducation à l`image 2015  Rusti Charme Sous-couche  VISCOSÍMETRO ROTACIONAL ROTATIONAL  LP-8115 & LP-8140 RGB LED PROJECTOR user manual  Une qualité exceptionnelle dans la poche  Le p`tit sylvanais  AVG AntiVirus 2015 User Manual  Da-Lite Da-Snap  AEDI STAR GROUND user manual    

Copyright © All rights reserved.
Failed to retrieve file