Saturday 11 November 2017

Autoregressiv Bewegend Durchschnittlich Spss


ARMA und ARIMA (Box-Jenkins) Modelle ARMA und ARIMA (Box-Jenkins) In den vorangegangenen Abschnitten haben wir gesehen, wie der Wert einer univariaten Zeitreihe zum Zeitpunkt t ist. X t. Kann mit einer Vielzahl von gleitenden durchschnittlichen Ausdrücken modelliert werden. Wir haben auch gezeigt, dass Komponenten wie Trends und Periodizität in der Zeitreihe explizit modelliert und abgetrennt werden können, wobei die Daten in Trend-, Saison - und Restkomponenten zerlegt werden. Wir haben auch in den früheren Diskussionen über Autokorrelation gezeigt. Dass die vollen und partiellen Autokorrelationskoeffizienten bei der Identifizierung und Modellierung von Mustern in Zeitreihen äußerst nützlich sind. Diese beiden Aspekte der Zeitreihenanalyse und Modellierung können in einem allgemeineren und oftmals sehr effektiven Gesamtmodellierungsrahmen kombiniert werden. In seiner Grundform ist dieser Ansatz als ARMA-Modellierung (autoregressiver gleitender Durchschnitt) bekannt, oder wenn die Differenzierung in das Verfahren einbezogen wird, ist die ARIMA - oder Box-Jenkins-Modellierung nach den beiden Autoren, die für ihre Entwicklung von zentraler Bedeutung waren (siehe Box amp Jenkins, 1968) BOX1 und Box, Jenkins amp Reinsel, 1994 BOX2). Es gibt keine feste Regel in Bezug auf die Anzahl der Zeiträume, die für eine erfolgreiche Modellierung erforderlich sind, aber für komplexere Modelle und für mehr Vertrauen in Fit und Validierung Verfahren, Serie mit 50 Zeitschritten werden oft empfohlen. ARMA-Modelle kombinieren Autokorrelationsmethoden (AR) und gleitende Durchschnitte (MA) zu einem zusammengesetzten Modell der Zeitreihe. Bevor man bedenkt, wie diese Modelle kombiniert werden können, untersuchen wir jeden separat. Wir haben bereits gesehen, dass gleitende durchschnittliche (MA) Modelle verwendet werden können, um eine gute Anpassung an einige Datensätze zu liefern, und Variationen auf diesen Modellen, die doppelte oder dreifache exponentielle Glättung beinhalten, können Trend und periodische Komponenten in den Daten verarbeiten. Darüber hinaus können solche Modelle verwendet werden, um Prognosen zu erstellen, die das Verhalten früherer Perioden nachahmen. Eine einfache Form solcher Modelle, die auf früheren Daten basiert, kann geschrieben werden als: Wo die Beta-i-Terme die Gewichte sind, die auf vorherige Werte in der Zeitreihe angewendet werden, und es ist üblich, Beta i 1 ohne Verlust der Allgemeinheit zu definieren. Also für einen ersten Bestellprozess q 1 und wir haben das Modell: d. h. der gleitende Mittelwert wird als gewichteter Durchschnitt der aktuellen und unmittelbaren vergangenen Werte geschätzt. Dieser Mittelungsprozess ist in gewissem Sinne ein pragmatischer Glättungsmechanismus ohne direkte Verbindung zu einem statistischen Modell. Allerdings können wir ein statistisches (oder stochastisches) Modell angeben, das die Prozeduren der sich bewegenden Mittelwerte in Verbindung mit zufälligen Prozessen umfasst. Wenn wir einen Satz von unabhängigen und identisch verteilten Zufallsvariablen (ein zufälliger Prozess) mit null mittlerer und bekannter fester Varianz lassen, dann können wir den Prozeß als gleitenden Durchschnitt der Ordnung q in Form von: klar den erwarteten Wert von xt unter schreiben Dieses Modell ist 0, so dass das Modell nur gültig ist, wenn das xt bereits angepasst wurde, um einen Null-Mittelwert zu haben, oder wenn eine feste Konstante (der Mittelwert des xt) zur Summierung hinzugefügt wird. Es ist auch offensichtlich, dass die Varianz von xt einfach ist: Die obige Analyse kann ausgedehnt werden, um die Kovarianz cov (x t. Xtk) zu bewerten, die Ausbeuten ergibt: Beachten Sie, dass weder der Mittelwert noch die Kovarianz (oder Autokovarianz) Bei lag k ist eine Funktion der Zeit, t. So ist der Prozess zweiter Ordnung stationär. Der obige Ausdruck ermöglicht es uns, einen Ausdruck für die Autokorrelationsfunktion (acf) zu erhalten: Wenn k 0 rho k 1 und für k gt q rho k 0. Weiterhin ist der acf symmetrisch und rho k rho - k. Die acf kann für einen MA-Prozess erster Ordnung berechnet werden: Die autoregressive oder AR-Komponente eines ARMA-Modells kann in der Form geschrieben werden: wobei die Begriffe in Autokorrelationskoeffizienten bei Verzögerungen 1,2 sind. P und z t ist ein Restfehlerterm. Beachten Sie, dass dieser Fehlerbegriff speziell auf den aktuellen Zeitraum, t. Also für einen ersten Ordnung Prozess, p 1 und wir haben das Modell: Diese Ausdrücke geben an, dass der Schätzwert von x zum Zeitpunkt t durch den unmittelbar vorherigen Wert von x (dh zum Zeitpunkt t -1) multipliziert mit einem Maß, alpha bestimmt wird . Von dem Ausmaß, in dem die Werte für alle Paare von Werten zu Zeitperioden, die 1 auseinander liegen, korreliert sind (d. h. ihre Autokorrelation), plus einen Restfehlerterm z. Zum Zeitpunkt t. Aber das ist genau die Definition eines Markov-Prozesses. So ist ein Markov-Prozess ein autoregressiver Prozess erster Ordnung. Wenn alpha 1 das Modell sagt, dass der nächste Wert von x ist einfach der vorherige Wert plus ein zufälliger Fehler Begriff, und daher ist eine einfache 1D zufällige zu Fuß. Wenn mehr Begriffe enthalten sind, schätzt das Modell den Wert von x zum Zeitpunkt t um eine gewichtete Summe dieser Ausdrücke plus einer zufälligen Fehlerkomponente. Wenn wir den zweiten Ausdruck oben in den ersten ersetzen, so haben wir: und wiederholte Anwendung dieser Substitutionsausbeute: Wenn nun alpha lt1 und k groß ist, kann dieser Ausdruck in umgekehrter Reihenfolge mit abnehmenden Begriffen und mit Beitrag aus dem Begriff geschrieben werden In x auf der rechten Seite des Ausdrucks verschwindend klein, also haben wir: Da die rechte Seite dieses Ausdrucks xt als Summe eines gewichteten Satzes von vorherigen Werten, in diesem Fall zufälligen Fehlerbegriffen, ist es klar, dass Dieses AR-Modell ist in der Tat eine Form von MA-Modell. Und wenn wir annehmen, dass die Fehlerterme null Mittelwert und konstante Varianz haben, dann haben wir wie im MA-Modell den erwarteten Wert des Modells als auch 0, vorausgesetzt, die xt wurden angepasst, um einen Null-Mittelwert zu liefern, mit Varianz: Jetzt als Lang wie alpha lt1 diese summation ist endlich und ist einfach 1 (1- alpha), also haben wir: Wie bei dem MA-Modell oben kann diese Analyse erweitert werden, um die Kovarianz, cov (x t. x tk) eines ersten zu bewerten Bestellen AR-Prozess, bei dem wir Ausbeuten finden: Für alpha lt1 ist diese Summation endlich und ist einfach alpha k (1 alpha 2), also haben wir: Das zeigt, dass für ein autoregressives Modell erster Ordnung die Autokorrelationsfunktion (acf) einfach definiert ist Durch aufeinanderfolgende Kräfte der Autokorrelation erster Ordnung, mit der Bedingung alpha lt1. Für alpha gt0 ist dies einfach eine schnell abnehmende Kraft oder exponentiell-ähnliche Kurve, die zu null neigt, oder für lt0 ist es eine dämpfende Oszillationskurve, die wiederum zu null neigt. Wenn eine Annahme gemacht wird, dass die Zeitreihe stationär ist, kann die obige Analyse auf Autokorrelationen der zweiten und höheren Ordnung ausgedehnt werden. Um ein AR-Modell an einen beobachteten Datensatz anzupassen, versuchen wir, die Summe der quadratischen Fehler (eine kleinste Quadrate-Anpassung) mit der kleinsten Anzahl von Begriffen zu minimieren, die eine zufriedenstellende Anpassung an die Daten liefern. Modelle dieser Art werden als autoregressiv bezeichnet. Und kann sowohl auf Zeitreihen als auch auf räumliche Datensätze angewendet werden (siehe weitere räumliche Autoregressionsmodelle). Obwohl in der Theorie ein autoregressives Modell eine gute Anpassung an einen beobachteten Datensatz liefern könnte, würde es im Allgemeinen eine vorherige Entfernung von und Trend und periodischen Komponenten erfordern, und selbst dann könnte eine große Anzahl von Begriffen erforderlich sein, um eine gute Anpassung an die Daten zu liefern. Durch die Kombination der AR-Modelle mit MA-Modellen können wir jedoch eine Familie von gemischten Modellen produzieren, die in einer Vielzahl von Situationen angewendet werden können. Diese Modelle sind als ARMA - und ARIMA-Modelle bekannt und werden in den folgenden Unterabschnitten beschrieben. In den beiden vorangegangenen Unterabschnitten haben wir den MA-Modus der Ordnung q eingeführt: und das AR-Modell der Ordnung p: Wir können diese beiden Modelle kombinieren, indem wir sie einfach als Modell der Ordnung (S. q) addieren, wo wir p AR-Terme haben Und q MA-Begriffe: Im Allgemeinen kann diese Form des kombinierten ARMA-Modells verwendet werden, um eine Zeitreihe mit weniger Begriffen insgesamt als entweder ein MA oder ein AR-Modell selbst zu modellieren Es gibt den Schätzwert zum Zeitpunkt t als die Summe von q Terme aus, die die durchschnittliche Variation der zufälligen Variation über q vorherige Perioden (die MA-Komponente) plus die Summe von p AR-Terme repräsentieren, die den aktuellen Wert von x als gewichtete Summe berechnen Der p aktuellsten Werte. Diese Modellform geht jedoch davon aus, dass die Zeitreihe stationär ist, was selten der Fall ist. In der Praxis gibt es Trends und Periodizität in vielen Datensätzen, so dass es notwendig ist, diese Effekte vor der Anwendung solcher Modelle zu entfernen. Die Entfernung wird typischerweise durchgeführt, indem man in das Modell eine anfängliche Differenzierungsstufe einbringt, typischerweise einmal, zweimal oder dreimal, bis die Reihe zumindest annähernd stationär ist und keine offensichtlichen Trends oder Periodizitäten aufweist. Wie bei den MA - und AR-Prozessen wird der Differenzierungsprozess durch die Reihenfolge der Differenzierung, z. B. 1, 2, 3 beschrieben. Diese drei Elemente bilden zusammen ein Tripel: (p. D. Q), das die Art des angewandten Modells definiert. In dieser Form wird das Modell als ARIMA-Modell beschrieben. Der Brief I in ARIMA bezieht sich auf die Tatsache, dass der Datensatz zunächst differenziert wurde (vgl. Differenzierung), und wenn die Modellierung abgeschlossen ist, müssen die Ergebnisse dann summiert oder integriert werden, um die endgültigen Schätzungen und Prognosen zu erstellen. ARIMA-Modellierung wird unten diskutiert. Wie im vorigen Unterabschnitt erwähnt, bietet die Kombination von Differenzierung einer nichtstationären Zeitreihe mit dem ARMA-Modell eine leistungsfähige Modellfamilie, die in einer Vielzahl von Situationen angewendet werden kann. Die Entwicklung dieser erweiterten Modellform ist vor allem auf G E P Box und G M Jenkins zurückzuführen, so dass ARIMA Modelle auch als Box-Jenkins Modelle bekannt sind. Der erste Schritt in der Box-Jenkins-Prozedur ist, die Zeitreihe zu differenzieren, bis sie stationär ist, wodurch sichergestellt wird, dass Trend - und Saisonkomponenten entfernt werden. In vielen Fällen genügt ein oder zwei Stufen-Unterschiede. Die differenzierte Reihe wird kürzer sein als die Quellserie um c-Zeitschritte, wobei c der Bereich der Differenzierung ist. Anschließend wird ein ARMA-Modell an die daraus resultierenden Zeitreihen angepasst. Da ARIMA-Modelle drei Parameter haben, gibt es viele Variationen zu den möglichen Modellen, die eingebaut werden könnten. Die Entscheidung darüber, welche Parameter diese Parameter sein sollten, kann jedoch durch eine Reihe von Grundprinzipien geleitet werden: (i) das Modell sollte so einfach wie möglich sein, dh möglichst wenige Begriffe enthalten, was wiederum die Werte von p und q bedeutet Sollte klein sein (ii) die Anpassung an historische Daten sollte so gut wie möglich sein, dh die Größe der quadratischen Unterschiede zwischen dem geschätzten Wert zu einem beliebigen vergangenen Zeitraum und dem tatsächlichen Wert, sollte minimiert werden (kleinste Quadrate Prinzip) - die Residuen Aus dem ausgewählten Modell kann dann untersucht werden, ob irgendwelche verbleibenden Residuen signifikant von 0 verschieden sind (siehe weiter unten) (iii) die gemessene partielle Autokorrelation bei Verzögerungen 1,2,3. Sollte einen Hinweis auf die Reihenfolge der AR-Komponente geben, dh der für q (iv) gewählte Wert für die Form der Autokorrelationsfunktion (acf) kann den Typ des ARIMA-Modells vorschlagen - die untenstehende Tabelle (aus dem NIST) gibt Anleitung dazu Interpretation der Form des acf in Bezug auf die Modellauswahl. ARIMA Modelltyp Auswahl mit acf Form Serie ist nicht stationär. Standard-ARIMA-Modelle werden oft durch das Dreifach beschrieben: (p. D. Q) wie oben erwähnt. Diese definieren die Struktur des Modells in Bezug auf die Reihenfolge der AR, differencing und MA Modelle verwendet werden. Es ist auch möglich, ähnliche Parameter für die Saisonalität in die Daten aufzunehmen, obwohl solche Modelle komplexer zu passen und zu interpretieren sind - der Kuttel (P. D. Q) wird im Allgemeinen verwendet, um solche Modellkomponenten zu identifizieren. In dem unten dargestellten Screenshot von SPSS wird der Dialog zur manuellen Auswahl von nicht-saisonalen und saisonalen Strukturelementen angezeigt (ähnliche Einrichtungen sind in anderen integrierten Paketen wie SASETS verfügbar). Wie zu sehen ist, ermöglicht der Dialog auch die Umwandlung der Daten (typischerweise zur Unterstützung der Varianzstabilisierung) und ermöglicht es Benutzern, eine Konstante im Modell (die Voreinstellung) einzuschließen. Dieses spezielle Software-Tool ermöglicht es, Ausreißer, falls erforderlich, nach einem Bereich von Erkennungsverfahren zu ermitteln, aber in vielen Fällen werden Ausreißer untersucht und angepasst oder entfernt und Ersatzwerte geschätzt, vor einer solchen Analyse. SPSS Time Series Modeler: ARIMA Modellierung, Expertenmodus Eine Reihe von ARIMA Modellen kann manuell oder über einen automatisierten Prozess (zB ein schrittweiser Prozess) an die Daten angepasst werden und eine oder mehrere Messungen beurteilen, was am besten ist Fit und sparsam Der Modellvergleich verwendet typischerweise eine oder mehrere der in diesem Handbuch beschriebenen Informationstheoretischen Maßnahmen - AIC, BIC und MDL (die R-Funktion arima (), liefert die AIC-Messung, während SPSS eine Reihe von Fit-Maßnahmen bietet Version der BIC-Statistik andere Werkzeuge variieren in den vorgesehenen Maßnahmen - Minitab, die eine Reihe von TSA-Methoden bietet, enthält keine AICBIC-Typ-Statistiken). In der Praxis kann eine breite Palette von Maßnahmen (dh andere als zusätzlich zu den kleinsten quadratbasierten Maßnahmen zur Auswertung der Modellqualität verwendet werden. Beispielsweise kann der mittlere absolute Fehler und der maximale absolute Fehler nützliche Maßnahmen sein, da auch ein gutes Minimum Die Anzahl der Softwarepakete kann auch ein Gesamtmaß für die Autokorrelation liefern, die nach der Montage des Modells in den Residuen verbleiben kann. Eine häufig angewandte Statistik ist auf Ljung und Box (1978 LJU1) zurückzuführen Ist von der Form: wobei n die Anzahl der Samples (Datenwerte) ist, ri die Probenautokorrelation bei Verzögerung i ist und k die Gesamtzahl der Verzögerungen ist, über die die Berechnung durchgeführt wird. Q k ist annähernd als chi verteilt - quadratische Verteilung mit k - m Freiheitsgraden, wobei m die Anzahl der Parameter ist, die bei der Anpassung des Modells verwendet werden, ohne jegliche Konstante oder Prädiktor - Variablen (dh nur die pd q Triple). Wenn das Maß statistisch signifikant ist, zeigt dies an Die Reste enthalten nach dem Modell noch eine signifikante Autokorrelation, was darauf hindeutet, dass ein verbessertes Modell gesucht werden sollte. Beispiel: Modellierung des Wachstums der Passagierzahlen der Fluggäste Im Folgenden finden Sie ein Beispiel für eine automatisierte Montage, mit SPSS an die Box-Jenkins-Reinsel-Testdaten der Flugzeugpassagiernummern REI1, die zuvor in diesem Handbuch zur Verfügung gestellt wurden. Anfänglich wurde keine Angabe der Daten, die Monate innerhalb von Jahren angegeben wurden, angegeben. Das Modell, das durch den automatisierten Prozess ausgewählt wurde, war ein ARIMA-Modell (0,1,12), dh der Prozess wurde korrekt identifiziert, dass die Serie eine Ebene der Differenzierung benötigte und ein gleitendes Durchschnittsmodell mit einer Periodizität von 12 und ohne Autokorrelationskomponente anpasste Daten. Die Modellanpassung erzeugte einen R 2 - Wert von 0,966, der sehr hoch ist, und ein maximaler absoluter Fehler (MAE) von 75. Die visuelle Anpassung des Modells an die Daten sieht hervorragend aus, aber die Auftragung der Restautokorrelation nach der Montage und Ljung - Box-Test zeigt, dass eine signifikante Autokorrelation verbleibt, was darauf hinweist, dass ein verbessertes Modell möglich ist. Automatisierte ARIMA-Anpassung an die International Airline Passagiere: Monthly Totals, 1949-1960 Um dies zu untersuchen, wurde ein überarbeitetes Modell auf der Grundlage der Diskussion dieses Datensatzes von Box und Jenkins (1968) und der aktualisierten Ausgabe von Chatfields (1975 CHA1) Buch in Die er Minitab benutzt, um seine Analyse zu illustrieren (6. Auflage 2003). Die Zeitreihe wurde mit einer Periodizität von 12 Monaten und einem ARIMA-Modell mit Komponenten (0,1,1), (0,1,1) definiert. Grafisch sehen die Ergebnisse dem obigen Diagramm sehr ähnlich aus, aber bei diesem Modell ist das R-Quadrat 0,991, die MAE41 und die Ljung-Box-Statistik ist nicht mehr signifikant (12,6, mit 16 Freiheitsgraden). Das Modell ist also eine Verbesserung der ursprünglichen (automatisch generierten) Version, die aus einer nicht-saisonalen MA und einer saisonalen MA-Komponente besteht, keine autoregressive Komponente und eine Ebene der Differenzierung für die saisonalen und nicht-saisonalen Strukturen. Ob die Montage manuell oder automatisiert ist, ein ARIMA-Modell kann einen guten Rahmen für die Modellierung einer Zeitreihe bieten, oder es kann sein, dass alternative Modelle oder Ansätze ein zufriedenstellenderes Ergebnis liefern. Oft ist es schwierig, im voraus zu wissen, wie gut ein gegebenes Prognosemodell wahrscheinlich ist, da es nur im Lichte seiner Fähigkeit ist, zukünftige Werte der Datenreihe vorauszusagen, dass es wirklich beurteilt werden kann. Oft wird dieser Prozess durch die Anpassung des Modells an vergangene Daten ohne die jüngsten Zeiträume (auch als Hold-out-Samples bekannt) angenähert, und dann mit dem Modell, um diese bekannten zukünftigen Ereignisse vorherzusagen, aber auch dies bietet nur begrenztes Vertrauen in seine zukünftige Gültigkeit. Längerfristige Prognosen können mit solchen Methoden extrem unzuverlässig sein. Eindeutig ist das oben beschriebene internationale Flugverkehrsstatistikmodell nicht in der Lage, Passagierzahlen bis in die 90er Jahre und darüber hinaus vorhersagen zu können, noch der 5-Jahres-Rückgang der US-Passagierzahlen der US-Fluggesellschaft nach 9112001. Ebenso kann ein ARIMA-Modell an historische Werte angepasst werden Der Börsenkurse oder Indexwerte (z. B. der NYSE - oder FTSE-Indizes) und wird in der Regel eine hervorragende Anpassung an die Daten liefern (was einen R-Quadratwert von besser als 0,99 ergibt), sind aber oftmals wenig für die Prognose zukünftiger Werte dieser Preise Oder indizes Typischerweise werden ARIMA-Modelle für die Prognose eingesetzt, insbesondere im Bereich der makro - und mikroökonomischen Modellierung. Allerdings können sie in einer Vielzahl von Disziplinen angewendet werden, entweder in der hier beschriebenen Form oder ergänzt durch zusätzliche Prädiktorvariablen, von denen angenommen wird, dass sie die Zuverlässigkeit der Prognosen verbessern. Letztere sind wichtig, weil die gesamte Struktur der oben diskutierten ARMA-Modelle von vorherigen Werten und unabhängigen zufälligen Ereignissen über die Zeit abhängt, nicht auf irgendwelche erklärenden oder ursächlichen Faktoren. Daher werden ARIMA-Modelle nur die bisherigen Muster reflektieren und verlängern, die möglicherweise in Prognosen durch Faktoren wie das makroökonomische Umfeld, Technologieverschiebungen oder längerfristige Ressourcen und Umweltveränderungen modifiziert werden müssen. BOX1 Box G E P, Jenkins G M (1968). Einige jüngste Fortschritte in der Prognose und Kontrolle. Angewandte Statistik, 17 (2), 91-109 BOX2 Box, G E P, Jenkins, G M, Reinsel G C (1994) Zeitreihenanalyse, Vorhersage und Kontrolle. 3. Aufl. Prentice Hall, Englewood Cliffs, NJ CHA1 Chatfield C (1975) Die Analyse der Times Serie: Theorie und Praxis. Chapman und Hall, London (siehe auch, 6. Aufl. 2003) LJU1 Ljung G M, Box G E P (1978) Auf einem Maß an Mangel an Fit in Time Series Models. Biometrika, 65, 297303 NISTSEMATECH e-Handbuch der statistischen Methoden, itl. nist. govdiv898handbook Abschnitt 6.4: Einführung in die Zeitreihe. 2010 SPSSPASW 17 (2008) AnalyzeForecasting (Time Series Models) REI1 Reinsel GC Datensätze für Box-Jenkins Modelle: Stat. wisc. eduSPSS On-Line Training Workshop Time Series Verfahren bietet die Werkzeuge für die Erstellung von Modellen, die Anwendung eines bestehenden Modells für die Zeitreihenanalyse , Saisonale Zersetzung und Spektralanalyse von Zeitreihendaten sowie Werkzeuge zur Berechnung von Autokorrelationen und Kreuzkorrelationen. Die folgenden zwei Videoclips zeigen, wie man ein exponentielles Glättungs-Zeitreihenmodell erstellt und wie man ein bestehendes Zeitreihenmodell zur Analyse von Zeitreihendaten anwendet. FILM: Exponentielles Glättungsmodell FILM: ARIMA Modell amp Expert Modeler Tool In diesem Online-Workshop finden Sie viele Videoclips. Jeder Filmclip zeigt einige spezifische Verwendung von SPSS. TS-Modelle erstellen Es gibt verschiedene Methoden in SPSS zur Erstellung von Time Series Models. Es gibt Verfahren für exponentielle Glättung, univariate und multivariate Autoregressive Integrated Moving-Average (ARIMA) Modelle. Diese Verfahren erzeugen Prognosen. Glättungsmethoden in der Prognose - Bewegungsdurchschnitte, gewichtete Bewegungsdurchschnitte und exponentielle Glättungsmethoden werden häufig bei der Prognose verwendet. Das Hauptziel jeder dieser Methoden ist es, die zufälligen Schwankungen in der Zeitreihe zu glätten. Diese sind wirksam, wenn die Zeitreihen keine signifikanten Tendenz, zyklische oder saisonale Effekte aufweisen. Das ist, die Zeitreihe ist stabil. Glättungsmethoden sind in der Regel gut für Kurzstreckenprognosen. Moving Averages: Moving Averages verwendet den Durchschnitt der aktuellsten k Datenwerte in der Zeitreihe. Nach Definition, MA S (die letzten k-Werte) k. Die durchschnittliche MA ändert sich, wenn neue Beobachtungen verfügbar werden. Weighted Moving Average: Bei MA-Methode erhält jeder Datenpunkt das gleiche Gewicht. Im gewichteten gleitenden Durchschnitt verwenden wir für jeden Datenpunkt unterschiedliche Gewichte. Bei der Auswahl der Gewichte berechnen wir den gewichteten Durchschnitt der letzten k Datenwerte. In vielen Fällen erhält der aktuellste Datenpunkt das meiste Gewicht und das Gewicht verringert sich für ältere Datenpunkte. Die Summe der Gewichte ist gleich 1. Eine Möglichkeit, Gewichte auszuwählen, besteht darin, Gewichte zu verwenden, die das mittlere quadratische Fehler (MSE) - Kriterium minimieren. Exponentielle Glättungsmethode. Dies ist eine spezielle gewichtete Durchschnittsmethode. Diese Methode wählt das Gewicht für die aktuellste Beobachtung aus und Gewichte für ältere Beobachtungen werden automatisch berechnet. Diese anderen Gewichte sinken, wenn die Beobachtungen älter werden. Das grundlegende exponentielle Glättungsmodell ist, wo F t 1 für die Periode t 1, t Beobachtung in der Periode t prognostiziert. F t Vorhersage für Periode t. Und einen Glättungsparameter (oder konstant) (0 lt a lt1). Für eine Zeitreihe setzen wir F 1 1 für Periode 1 und nachfolgende Prognosen für die Perioden 2, 3, können nach der Formel für F t 1 berechnet werden. Mit diesem Ansatz kann man zeigen, dass die exponentielle Glättungsmethode ein gewichteter Durchschnitt aller bisherigen Datenpunkte in der Zeitreihe ist. Einmal ist bekannt, müssen wir t und F t kennen, um die Prognose für die Periode t 1 zu berechnen. Im Allgemeinen wählen wir eine a, die das MSE minimiert. Einfach: passend für Serien, in denen es keinen Trend oder Saisonalität gibt. Moving Average (q) Komponente: Verschieben von durchschnittlichen Ordnungen legen fest, wie Abweichungen von der Serie für vorherige Werte verwendet werden, um aktuelle Werte vorherzusagen. Expert Time Series Modeler bestimmt automatisch die beste Passform für die Zeitreihendaten. Standardmäßig berücksichtigt der Expert Modeler sowohl exponentielle Glättung als auch ARIMA-Modelle. Der Benutzer kann nur ARIMA - oder Glättungsmodelle auswählen und die automatische Erkennung von Ausreißern angeben. Der folgende Filmclip veranschaulicht, wie ein ARIMA-Modell mit der ARIMA-Methode und dem Expert Modeler von SPSS bereitgestellt wird. Der für diese Demonstration verwendete Datensatz ist der AirlinePassenger-Datensatz. Weitere Informationen finden Sie auf der Seite Datensatz. Die Fluggastdaten werden als Reihe G im Buch Zeitreihenanalyse: Vorhersage und Kontrolle durch Box und Jenkins (1976) gegeben. Die variable Zahl ist der monatliche Passagier in Tausend. Unter der Log-Transformation wurden die Daten in der Literatur analysiert. Anwenden von Zeitreihenmodellen. Diese Prozedur lädt ein bestehendes Zeitreihenmodell aus einer externen Datei und das Modell wird auf das aktive SPSS-Dataset angewendet. Dies kann verwendet werden, um Prognosen für Serien zu erhalten, für die neue oder überarbeitete Daten verfügbar sind, ohne ein neues Modell aufzubauen. Das Hauptdialogfeld ähnelt dem Hauptdialogfeld "Modelle erstellen". Spektralanalyse . Dieser Vorgang kann verwendet werden, um periodisches Verhalten in Zeitreihen zu zeigen. Sequenzdiagramme. Diese Vorgehensweise wird verwendet, um Fälle nacheinander zu zeichnen. Um diese Prozedur auszuführen, benötigen Sie eine Zeitreihendaten oder einen Datensatz, der in einer aussagekräftigen Reihenfolge sortiert ist. Autokorrelationen. Diese Prozedur zeichnet die Autokorrelationsfunktion und die partielle Autokorrelationsfunktion einer oder mehrerer Zeitreihen auf. Kreuz-Korrelationen. Diese Prozedur zeichnet die Kreuzkorrelationsfunktion von zwei oder mehr Zeitreihen für positive, negative und Null-Verzögerungen auf. Weitere Informationen zum Anwenden von Zeitreihenmodellen, Spektralanalyse, Sequenzdiagrammen, Autokorrelationen und Kreuzkorrelationsverfahren finden Sie im SPSS-Hilfemenü. T seine Online-SPSS Training Workshop wird von Dr. Carl Lee, Dr. Felix Famoye entwickelt. Studentenassistenten Barbara Shelden und Albert Brown. Abteilung für Mathematik, Central Michigan University. Alle Rechte vorbehalten. ARMA und ARIMA (Box-Jenkins) Modelle ARMA und ARIMA (Box-Jenkins) Modelle In den vorangegangenen Abschnitten haben wir gesehen, wie der Wert einer univariaten Zeitreihe zum Zeitpunkt t. X t. Kann mit einer Vielzahl von gleitenden durchschnittlichen Ausdrücken modelliert werden. Wir haben auch gezeigt, dass Komponenten wie Trends und Periodizität in der Zeitreihe explizit modelliert und abgetrennt werden können, wobei die Daten in Trend-, Saison - und Restkomponenten zerlegt werden. Wir haben auch in den früheren Diskussionen über Autokorrelation gezeigt. Dass die vollen und partiellen Autokorrelationskoeffizienten bei der Identifizierung und Modellierung von Mustern in Zeitreihen äußerst nützlich sind. Diese beiden Aspekte der Zeitreihenanalyse und Modellierung können in einem allgemeineren und oftmals sehr effektiven Gesamtmodellierungsrahmen kombiniert werden. In seiner Grundform ist dieser Ansatz als ARMA-Modellierung (autoregressiver gleitender Durchschnitt) bekannt, oder wenn die Differenzierung in das Verfahren einbezogen wird, ist die ARIMA - oder Box-Jenkins-Modellierung nach den beiden Autoren, die für ihre Entwicklung von zentraler Bedeutung waren (siehe Box amp Jenkins, 1968) BOX1 und Box, Jenkins amp Reinsel, 1994 BOX2). Es gibt keine feste Regel in Bezug auf die Anzahl der Zeiträume, die für eine erfolgreiche Modellierung erforderlich sind, aber für komplexere Modelle und für mehr Vertrauen in Fit und Validierung Verfahren, Serie mit 50 Zeitschritten werden oft empfohlen. ARMA-Modelle kombinieren Autokorrelationsmethoden (AR) und gleitende Durchschnitte (MA) zu einem zusammengesetzten Modell der Zeitreihe. Bevor man bedenkt, wie diese Modelle kombiniert werden können, untersuchen wir jeden separat. Wir haben bereits gesehen, dass gleitende durchschnittliche (MA) Modelle verwendet werden können, um eine gute Anpassung an einige Datensätze zu liefern, und Variationen auf diesen Modellen, die doppelte oder dreifache exponentielle Glättung beinhalten, können Trend und periodische Komponenten in den Daten verarbeiten. Darüber hinaus können solche Modelle verwendet werden, um Prognosen zu erstellen, die das Verhalten früherer Perioden nachahmen. Eine einfache Form solcher Modelle, die auf früheren Daten basiert, kann geschrieben werden als: Wo die Beta-i-Terme die Gewichte sind, die auf vorherige Werte in der Zeitreihe angewendet werden, und es ist üblich, Beta i 1 ohne Verlust der Allgemeinheit zu definieren. Also für einen ersten Bestellprozess q 1 und wir haben das Modell: d. h. der gleitende Mittelwert wird als gewichteter Durchschnitt der aktuellen und unmittelbaren vergangenen Werte geschätzt. Dieser Mittelungsprozess ist in gewissem Sinne ein pragmatischer Glättungsmechanismus ohne direkte Verbindung zu einem statistischen Modell. Allerdings können wir ein statistisches (oder stochastisches) Modell angeben, das die Prozeduren der sich bewegenden Mittelwerte in Verbindung mit zufälligen Prozessen umfasst. Wenn wir einen Satz von unabhängigen und identisch verteilten Zufallsvariablen (ein zufälliger Prozess) mit null mittlerer und bekannter fester Varianz lassen, dann können wir den Prozeß als gleitenden Durchschnitt der Ordnung q in Form von: klar den erwarteten Wert von xt unter schreiben Dieses Modell ist 0, so dass das Modell nur gültig ist, wenn das xt bereits angepasst wurde, um einen Null-Mittelwert zu haben, oder wenn eine feste Konstante (der Mittelwert des xt) zur Summierung hinzugefügt wird. Es ist auch offensichtlich, dass die Varianz von xt einfach ist: Die obige Analyse kann ausgedehnt werden, um die Kovarianz cov (x t. Xtk) zu bewerten, die Ausbeuten ergibt: Beachten Sie, dass weder der Mittelwert noch die Kovarianz (oder Autokovarianz) Bei lag k ist eine Funktion der Zeit, t. So ist der Prozess zweiter Ordnung stationär. Der obige Ausdruck ermöglicht es uns, einen Ausdruck für die Autokorrelationsfunktion (acf) zu erhalten: Wenn k 0 rho k 1 und für k gt q rho k 0. Weiterhin ist der acf symmetrisch und rho k rho - k. Die acf kann für einen MA-Prozess erster Ordnung berechnet werden: Die autoregressive oder AR-Komponente eines ARMA-Modells kann in der Form geschrieben werden: wobei die Begriffe in Autokorrelationskoeffizienten bei Verzögerungen 1,2 sind. P und z t ist ein Restfehlerterm. Beachten Sie, dass dieser Fehlerbegriff speziell auf den aktuellen Zeitraum, t. Also für einen ersten Ordnung Prozess, p 1 und wir haben das Modell: Diese Ausdrücke geben an, dass der Schätzwert von x zum Zeitpunkt t durch den unmittelbar vorherigen Wert von x (dh zum Zeitpunkt t -1) multipliziert mit einem Maß, alpha bestimmt wird . Von dem Ausmaß, in dem die Werte für alle Paare von Werten zu Zeitperioden, die 1 auseinander liegen, korreliert sind (d. h. ihre Autokorrelation), plus einen Restfehlerterm z. Zum Zeitpunkt t. Aber das ist genau die Definition eines Markov-Prozesses. So ist ein Markov-Prozess ein autoregressiver Prozess erster Ordnung. Wenn alpha 1 das Modell sagt, dass der nächste Wert von x ist einfach der vorherige Wert plus ein zufälliger Fehler Begriff, und daher ist eine einfache 1D zufällige zu Fuß. Wenn mehr Begriffe enthalten sind, schätzt das Modell den Wert von x zum Zeitpunkt t um eine gewichtete Summe dieser Ausdrücke plus einer zufälligen Fehlerkomponente. Wenn wir den zweiten Ausdruck oben in den ersten ersetzen, so haben wir: und wiederholte Anwendung dieser Substitutionsausbeute: Wenn nun alpha lt1 und k groß ist, kann dieser Ausdruck in umgekehrter Reihenfolge mit abnehmenden Begriffen und mit Beitrag aus dem Begriff geschrieben werden In x auf der rechten Seite des Ausdrucks verschwindend klein, also haben wir: Da die rechte Seite dieses Ausdrucks xt als Summe eines gewichteten Satzes von vorherigen Werten, in diesem Fall zufälligen Fehlerbegriffen, ist es klar, dass Dieses AR-Modell ist in der Tat eine Form von MA-Modell. Und wenn wir annehmen, dass die Fehlerterme null Mittelwert und konstante Varianz haben, dann haben wir wie im MA-Modell den erwarteten Wert des Modells als auch 0, vorausgesetzt, die xt wurden angepasst, um einen Null-Mittelwert zu liefern, mit Varianz: Jetzt als Lang wie alpha lt1 diese summation ist endlich und ist einfach 1 (1- alpha), also haben wir: Wie bei dem MA-Modell oben kann diese Analyse erweitert werden, um die Kovarianz, cov (x t. x tk) eines ersten zu bewerten Bestellen AR-Prozess, bei dem wir Ausbeuten finden: Für alpha lt1 ist diese Summation endlich und ist einfach alpha k (1 alpha 2), also haben wir: Das zeigt, dass für ein autoregressives Modell erster Ordnung die Autokorrelationsfunktion (acf) einfach definiert ist Durch aufeinanderfolgende Kräfte der Autokorrelation erster Ordnung, mit der Bedingung alpha lt1. Für alpha gt0 ist dies einfach eine schnell abnehmende Kraft oder exponentiell-ähnliche Kurve, die zu null neigt, oder für lt0 ist es eine dämpfende Oszillationskurve, die wiederum zu null neigt. Wenn eine Annahme gemacht wird, dass die Zeitreihe stationär ist, kann die obige Analyse auf Autokorrelationen der zweiten und höheren Ordnung ausgedehnt werden. Um ein AR-Modell an einen beobachteten Datensatz anzupassen, versuchen wir, die Summe der quadratischen Fehler (eine kleinste Quadrate-Anpassung) mit der kleinsten Anzahl von Begriffen zu minimieren, die eine zufriedenstellende Anpassung an die Daten liefern. Modelle dieser Art werden als autoregressiv bezeichnet. Und kann sowohl auf Zeitreihen als auch auf räumliche Datensätze angewendet werden (siehe weitere räumliche Autoregressionsmodelle). Obwohl in der Theorie ein autoregressives Modell eine gute Anpassung an einen beobachteten Datensatz liefern könnte, würde es im Allgemeinen eine vorherige Entfernung von und Trend und periodischen Komponenten erfordern, und selbst dann könnte eine große Anzahl von Begriffen erforderlich sein, um eine gute Anpassung an die Daten zu liefern. Durch die Kombination der AR-Modelle mit MA-Modellen können wir jedoch eine Familie von gemischten Modellen produzieren, die in einer Vielzahl von Situationen angewendet werden können. Diese Modelle sind als ARMA - und ARIMA-Modelle bekannt und werden in den folgenden Unterabschnitten beschrieben. In den beiden vorangegangenen Unterabschnitten haben wir den MA-Modus der Ordnung q eingeführt: und das AR-Modell der Ordnung p: Wir können diese beiden Modelle kombinieren, indem wir sie einfach als Modell der Ordnung (S. q) addieren, wo wir p AR-Terme haben Und q MA-Begriffe: Im Allgemeinen kann diese Form des kombinierten ARMA-Modells verwendet werden, um eine Zeitreihe mit weniger Begriffen insgesamt als entweder ein MA oder ein AR-Modell selbst zu modellieren Es gibt den Schätzwert zum Zeitpunkt t als die Summe von q Terme aus, die die durchschnittliche Variation der zufälligen Variation über q vorherige Perioden (die MA-Komponente) plus die Summe von p AR-Terme repräsentieren, die den aktuellen Wert von x als gewichtete Summe berechnen Der p aktuellsten Werte. Diese Modellform geht jedoch davon aus, dass die Zeitreihe stationär ist, was selten der Fall ist. In der Praxis gibt es Trends und Periodizität in vielen Datensätzen, so dass es notwendig ist, diese Effekte vor der Anwendung solcher Modelle zu entfernen. Die Entfernung wird typischerweise durchgeführt, indem man in das Modell eine anfängliche Differenzierungsstufe einbringt, typischerweise einmal, zweimal oder dreimal, bis die Reihe zumindest annähernd stationär ist und keine offensichtlichen Trends oder Periodizitäten aufweist. Wie bei den MA - und AR-Prozessen wird der Differenzierungsprozess durch die Reihenfolge der Differenzierung, z. B. 1, 2, 3 beschrieben. Diese drei Elemente bilden zusammen ein Tripel: (p. D. Q), das die Art des angewandten Modells definiert. In dieser Form wird das Modell als ARIMA-Modell beschrieben. Der Brief I in ARIMA bezieht sich auf die Tatsache, dass der Datensatz zunächst differenziert wurde (vgl. Differenzierung), und wenn die Modellierung abgeschlossen ist, müssen die Ergebnisse dann summiert oder integriert werden, um die endgültigen Schätzungen und Prognosen zu erstellen. ARIMA-Modellierung wird unten diskutiert. Wie im vorigen Unterabschnitt erwähnt, bietet die Kombination von Differenzierung einer nichtstationären Zeitreihe mit dem ARMA-Modell eine leistungsfähige Modellfamilie, die in einer Vielzahl von Situationen angewendet werden kann. Die Entwicklung dieser erweiterten Modellform ist vor allem auf G E P Box und G M Jenkins zurückzuführen, so dass ARIMA Modelle auch als Box-Jenkins Modelle bekannt sind. Der erste Schritt in der Box-Jenkins-Prozedur ist, die Zeitreihe zu differenzieren, bis sie stationär ist, wodurch sichergestellt wird, dass Trend - und Saisonkomponenten entfernt werden. In vielen Fällen genügt ein oder zwei Stufen-Unterschiede. Die differenzierte Reihe wird kürzer sein als die Quellserie um c-Zeitschritte, wobei c der Bereich der Differenzierung ist. Anschließend wird ein ARMA-Modell an die daraus resultierenden Zeitreihen angepasst. Da ARIMA-Modelle drei Parameter haben, gibt es viele Variationen zu den möglichen Modellen, die eingebaut werden könnten. Die Entscheidung darüber, welche Parameter diese Parameter sein sollten, kann jedoch durch eine Reihe von Grundprinzipien geleitet werden: (i) das Modell sollte so einfach wie möglich sein, dh möglichst wenige Begriffe enthalten, was wiederum die Werte von p und q bedeutet Sollte klein sein (ii) die Anpassung an historische Daten sollte so gut wie möglich sein, dh die Größe der quadratischen Unterschiede zwischen dem geschätzten Wert zu einem beliebigen vergangenen Zeitraum und dem tatsächlichen Wert, sollte minimiert werden (kleinste Quadrate Prinzip) - die Residuen Aus dem ausgewählten Modell kann dann untersucht werden, ob irgendwelche verbleibenden Residuen signifikant von 0 verschieden sind (siehe weiter unten) (iii) die gemessene partielle Autokorrelation bei Verzögerungen 1,2,3. Sollte einen Hinweis auf die Reihenfolge der AR-Komponente geben, dh der für q (iv) gewählte Wert für die Form der Autokorrelationsfunktion (acf) kann den Typ des ARIMA-Modells vorschlagen - die untenstehende Tabelle (aus dem NIST) gibt Anleitung dazu Interpretation der Form des acf in Bezug auf die Modellauswahl. ARIMA Modelltyp Auswahl mit acf Form Serie ist nicht stationär. Standard-ARIMA-Modelle werden oft durch das Dreifach beschrieben: (p. D. Q) wie oben erwähnt. Diese definieren die Struktur des Modells in Bezug auf die Reihenfolge der AR, differencing und MA Modelle verwendet werden. Es ist auch möglich, ähnliche Parameter für die Saisonalität in die Daten aufzunehmen, obwohl solche Modelle komplexer zu passen und zu interpretieren sind - der Kuttel (P. D. Q) wird im Allgemeinen verwendet, um solche Modellkomponenten zu identifizieren. In dem unten dargestellten Screenshot von SPSS wird der Dialog zur manuellen Auswahl von nicht-saisonalen und saisonalen Strukturelementen angezeigt (ähnliche Einrichtungen sind in anderen integrierten Paketen wie SASETS verfügbar). Wie zu sehen ist, ermöglicht der Dialog auch die Umwandlung der Daten (typischerweise zur Unterstützung der Varianzstabilisierung) und ermöglicht es Benutzern, eine Konstante im Modell (die Voreinstellung) einzuschließen. Dieses spezielle Software-Tool ermöglicht es, Ausreißer, falls erforderlich, nach einem Bereich von Erkennungsverfahren zu ermitteln, aber in vielen Fällen werden Ausreißer untersucht und angepasst oder entfernt und Ersatzwerte geschätzt, vor einer solchen Analyse. SPSS Time Series Modeler: ARIMA Modellierung, Expertenmodus Eine Reihe von ARIMA Modellen kann manuell oder über einen automatisierten Prozess (zB ein schrittweiser Prozess) an die Daten angepasst werden und eine oder mehrere Messungen beurteilen, was am besten ist Fit und sparsam Der Modellvergleich verwendet typischerweise eine oder mehrere der in diesem Handbuch beschriebenen Informationstheoretischen Maßnahmen - AIC, BIC und MDL (die R-Funktion arima (), liefert die AIC-Messung, während SPSS eine Reihe von Fit-Maßnahmen bietet Version der BIC-Statistik andere Werkzeuge variieren in den vorgesehenen Maßnahmen - Minitab, die eine Reihe von TSA-Methoden bietet, enthält keine AICBIC-Typ-Statistiken). In practice a wide range of measures (i. e. other thanin addition to the least squares based measures, can be used to evaluate the model quality. For example, the mean absolute error and the maximum absolute error may be useful measures, since even a good least squares fit may still be poor in places. A number of software packages may also provide an overall measure of the autocorrelation that may remain in the residuals after fitting the model. A statistic frequently applied is due to Ljung and Box (1978 LJU1 ), and is of the form: where n is the number of samples (data values), r i is the sample autocorrelation at lag i. and k is the total number of lags over which the computation is carried out. Q k is approximately distributed as a chi-square distribution with k - m degrees of freedom, where m is the number of parameters used in fitting the model, excluding any constant term or predictor variables (i. e. just including the p. d. q triples). If the measure is statistically significant it indicates that the residuals still contain significant autocorrelation after the model has been fitted, suggesting that an improved model should be sought. Example: Modeling the growth of airline passenger numbers The following is an example of automated fitting, using SPSS to the Box-Jenkins-Reinsel test data of airline passenger numbers REI1 provided earlier in this Handbook. Initially no specification of the dates being months within years was specified. The model selected by the automated process was an ARIMA model (0,1,12), i. e. the process correctly identified that the series required one level of differencing and applied a moving average model with a periodicity of 12 and no autocorrelation component to fit the data. The model fit produced an R 2 value of 0.966, which is very high, and a maximum absolute error (MAE) of 75. The visual fit of the model to the data looks excellent, but the plot of the residual autocorrelation after fitting and Ljung-Box test shows that significant autocorrelation remains, indicating that an improved model is possible. Automated ARIMA fit to International Airline Passengers: Monthly Totals, 1949-1960 To investigate this further a revised model was fitted, based on the discussion of this dataset by Box and Jenkins (1968) and the updated edition of Chatfields (1975 CHA1 ) book in which he uses Minitab to illustrate his analysis (6th edition, 2003). The time series was defined as having a periodicity of 12 months and an ARIMA model with components (0,1,1),(0,1,1). Graphically the results look very similar to the chart above, but with this model the R-squared is 0.991, the MAE41 and the Ljung-Box statistic is no longer significant (12.6, with 16 degrees of freedom). The model is thus an improvement on the original (automatically generated) version, being comprised of a non-seasonal MA and a seasonal MA component, no autoregressive component, and one level of differencing for the seasonal and non-seasonal structures. Whether fitting is manual or automated, an ARIMA model may provide a good framework for modeling a time series, or it may be that alternative models or approaches provide a more satisfactory result. Often it is difficult to know in advance how good any given forecasting model is likely to be, since it is only in the light of its ability to predict future values of the data series that it can be truly judged. Often this process is approximated by fitting the model to past data excluding recent time periods (also known as hold-out samples ), and then using the model to predict these known future events, but even this offers only limited confidence in its future validity. Longer-term forecasting can be extremely unreliable using such methods. Clearly the international air traffic statistics model described above is not able to correctly predict passengers numbers through into the 1990s and beyond, nor the 5-year drop in US international airline passenger numbers post 9112001. Likewise, an ARIMA model can be fitted to historic values of stock exchange prices or index values (e. g. the NYSE or FTSE indices) and will typically provide an excellent fit to the data (yielding an R-squared value of better than 0.99) but are often of little use for forecasting future values of these prices or indices. Typically ARIMA models are used for forecasting, particularly in the field of macro - and micro-economic modeling. However, they can be applied in a wide range of disciplines, either in the form described here, or augmented with additional predictor variables that are believed to improve the reliability of the forecasts made. The latter are important because the entire structure of the ARMA models discussed above depends on prior values and independent random events over time, not on any explanatory or causative factors. Hence ARIMA models will only reflect and extend past patterns, which might need to be modified in forecasts by factors such as the macro-economic environment, technology shifts, or longer term resource andor environmental changes. BOX1 Box G E P, Jenkins G M (1968). Some recent advances in forecasting and control. Applied Statistics, 17(2), 91-109 BOX2 Box, G E P, Jenkins, G M, Reinsel G C (1994) Time Series Analysis, Forecasting and Control. 3. Aufl. Prentice Hall, Englewood Cliffs, NJ CHA1 Chatfield C (1975) The Analysis of Times Series: Theory and Practice. Chapman and Hall, London (see also, 6th ed. 2003) LJU1 Ljung G M, Box G E P (1978) On a Measure of a Lack of Fit in Time Series Models. Biometrika, 65, 297303 NISTSEMATECH e-Handbook of Statistical Methods, itl. nist. govdiv898handbook Section 6.4: Introduction to time series. 2010 SPSSPASW 17 (2008) AnalyzeForecasting (Time Series Models) REI1 Reinsel G C Datasets for Box-Jenkins models: stat. wisc. eduARIMA - SPSS Trends Introduction Edit This procedure estimates nonseasonal and seasonal univariate ARIMA ( A uto r egressive I ntegrated M oving A verage) models (also known as Box-Jenkins models) with or without fixed regressor variables. The procedure produces maximum-likelihood estimates and can process time series with missing observations. An example Edit You are in charge of quality control at a manufacturing plant and need to know if and when random fluctuations in product quality exceed their usual acceptable levels. Youve tried modeling product quality scores with an exponential smoothing model but foundpresumably because of the highly erratic nature of the datathat the model does little more than predict the overall mean and hence is of little use. ARIMA models are well suited for describing complex time series. After building an appropriate ARIMA model, you can plot the product quality scores along with the upper and lower confidence intervals produced by the model. Scores that fall outside of the confidence intervals may indicate a true decline in product quality. Illustration Edit For each iteration: seasonal and nonseasonal lags (autoregressive and moving average), regression coefficients, adjusted sum of squares, and Marquardt constant. For the final maximum-likelihood parameter estimates: residual sum of squares, adjusted residual sum of squares, residual variance, model standard error, log-likelihood, Akaikes information criterion, Schwartzs Bayesian criterion, regression statistics, correlation matrix, and covariance matrix. The dependent variable and any independent variables should be numeric. Assumption Edit The series should have a constant mean over time. Ad blocker interference detected Wikia is a free-to-use site that makes money from advertising. We have a modified experience for viewers using ad blockers Wikia is not accessible if youve made further modifications. Remove the custom ad blocker rule(s) and the page will load as expected.

No comments:

Post a Comment