ARMA Unplugged Dies ist der erste Eintrag in unserer Serie von Unplugged Tutorials, in dem wir uns in die Details der einzelnen Zeitreihenmodelle, mit denen Sie bereits vertraut sind, vertiefen, die zugrunde liegenden Annahmen hervorheben und die Intuitionen hinter ihnen nach Hause fahren. In dieser Ausgabe begegnen wir dem ARMA-Modell einen Eckpfeiler in der Zeitreihenmodellierung. Im Gegensatz zu früheren Analysenproblemen werden wir hier mit der ARMA-Prozessdefinition beginnen, die Inputs, Outputs, Parameter, Stabilitätsbeschränkungen, Annahmen ausgeben und schließlich einige Richtlinien für den Modellierungsprozess zeichnen. Hintergrund Nach Definition ist der auto-regressive gleitende Durchschnitt (ARMA) ein stationärer stochastischer Prozess, der aus Summen von autoregressivem Excel besteht und gleitende Durchschnittskomponenten bewegt. Alternativ, in einer einfachen Formulierung: Annahmen Lets Blick näher an die Formulierung. Der ARMA-Prozess ist einfach eine gewichtete Summe der bisherigen Output-Beobachtungen und Schocks mit wenigen Schlüsselannahmen: Was bedeuten diese Annahmen Ein stochastischer Prozess ist ein Gegenstück zu einem deterministischen Prozess, das die Evolution einer zufälligen Variablen über die Zeit beschreibt. In unserem Fall ist die Zufallsvariable Der ARMA-Prozess erfasst nur die serielle Korrelation (d. H. Autokorrelation) zwischen den Beobachtungen. In klaren Worten fasst der ARMA-Prozess die Werte der vergangenen Beobachtungen zusammen, nicht ihre quadratischen Werte oder deren Logarithmen usw. Die Abhängigkeit der höheren Ordnung erfordert einen anderen Prozess (z. B. ARCHGARCH, nichtlineare Modelle usw.). Es gibt zahlreiche Beispiele für einen stochastischen Prozess, bei dem vergangene Werte die aktuellen beeinflussen. Zum Beispiel in einem Verkaufsbüro, das laufende Ausschreibungen erhält, werden einige als verkaufsgewonnen, einige als verkäufe verloren, und ein paar verschüttet in den nächsten Monat. Als Ergebnis, in einem bestimmten Monat, einige der Verkäufe gewonnene Fälle entstehen als Anfragen oder sind Wiederholungsverkäufe von den vorhergehenden Monaten. Was sind die Schocks, Innovationen oder Fehler Begriffe Dies ist eine schwierige Frage, und die Antwort ist nicht weniger verwirrend. Dennoch können wir es ausprobieren: In einfachen Worten ist der Fehler in einem gegebenen Modell ein Fang aller Eimer für alle Variationen, die das Modell nicht erklärt. Noch verloren Lets verwenden ein Beispiel. Für einen Aktienkurs-Prozess gibt es möglicherweise Hunderte von Faktoren, die das Preisniveau aktualisieren, einschließlich: Dividenden und Split Ankündigungen Quarterly Ertragsberichte Merger und Akquisition (MampA) Aktivitäten Juristische Veranstaltungen, z. B. Die drohende Klageklage. Andere Ein Modell, durch Design, ist eine Vereinfachung einer komplexen Realität, also was auch immer wir außerhalb des Modells verlassen, wird automatisch im Fehlerbegriff gebündelt. Der ARMA-Prozess geht davon aus, dass die kollektive Wirkung all dieser Faktoren mehr oder weniger wie Gaußschen Lärm wirkt. Warum kümmern wir uns um vergangene Schocks. Anders als ein Regressionsmodell kann das Auftreten eines Stimulus (z. B. Schock) eine Auswirkung auf das aktuelle Niveau und möglicherweise zukünftige Ebenen haben. Zum Beispiel beeinflusst ein Unternehmensereignis (z. B. MampA-Aktivität) den Underling-Unternehmen Aktienkurs, aber die Änderung kann einige Zeit dauern, um seine volle Wirkung zu haben, da die Marktteilnehmer die verfügbaren Informationen analysieren und entsprechend reagieren. Das ist die Frage: Dont die Vergangenheit Werte der Ausgabe haben bereits die Schocks Vergangenheit Informationen JA, die Schocks Geschichte ist bereits in der Vergangenheit Ausgangswerte berücksichtigt. Ein ARMA-Modell kann nur als reines auto-regressives (AR) Modell dargestellt werden, aber der Speicherbedarf eines solchen Systems in unendlich. Dies ist der einzige Grund, die MA-Komponente einzuschließen: um die Lagerung zu speichern und die Formulierung zu vereinfachen. Auch hier muss der ARMA-Prozess stationär sein, damit die marginale (bedingungslose) Varianz existiert. Anmerkung: In meiner obigen Diskussion unterscheide ich nicht nur die Abwesenheit einer Einheitswurzel in der charakteristischen Gleichung und der Stationarität des Prozesses. Sie sind verwandt, aber das Fehlen einer Einheitswurzel ist keine Garantie für die Stationarität. Dennoch muss die Einheitswurzel im Inneren des Einheitskreises liegen, um genau zu sein. Schlussfolgerung Lass uns das wiederherstellen, was wir bisher gemacht haben. Zuerst untersuchten wir einen stationären ARMA-Prozess, zusammen mit seinen Formulierungen, Inputs, Annahmen und Speicheranforderungen. Als nächstes haben wir gezeigt, dass ein ARMA-Prozess seine Ausgangswerte (Autokorrelation) und Stöße, die er früher in der aktuellen Ausgabe erlebt hat, beinhaltet. Schließlich haben wir gezeigt, dass der stationäre ARMA-Prozess eine Zeitreihe mit einem stabilen Langzeit-Mittel und Varianz erzeugt. In unserer Datenanalyse sollten wir, bevor wir ein ARMA-Modell vorschlagen, die Stationaritätsannahme und den endlichen Speicherbedarf überprüfen. Für den Fall, dass die Datenreihe einen deterministischen Trend aufweist, müssen wir sie zuerst entfernen (de-trend) und dann die Reste für ARMA verwenden. In dem Fall, dass der Datensatz einen stochastischen Trend (z. B. zufälliger Spaziergang) oder Saisonalität aufweist, müssen wir ARIMASARIMA unterhalten. Schließlich kann das Korrelogramm (d. h. ACFPACF) verwendet werden, um den Speicherbedarf des Modells zu messen, und wir sollten erwarten, dass entweder ACF oder PACF schnell nach einigen Verzögerungen abklingen. Wenn nicht, kann dies ein Zeichen der Nicht-Stationarität oder eines Langzeitmusters sein (z. B. ARFIMA). Ein RIMA steht für autoregressive integrierte Moving Average Modelle. Univariate (Einzelvektor) ARIMA ist eine Prognosetechnik, die die zukünftigen Werte einer Serie, die ganz auf ihrer eigenen Trägheit basiert, projiziert. Seine Hauptanwendung liegt im Bereich der kurzfristigen Prognose, die mindestens 40 historische Datenpunkte erfordert. Es funktioniert am besten, wenn Ihre Daten ein stabiles oder konsistentes Muster im Laufe der Zeit mit einem Minimum an Ausreißern aufweisen. Manchmal genannt Box-Jenkins (nach den ursprünglichen Autoren) ist ARIMA in der Regel exponentiellen Glättungstechniken überlegen, wenn die Daten vernünftig lang sind und die Korrelation zwischen vergangenen Beobachtungen stabil ist. Wenn die Daten kurz oder stark flüchtig sind, kann eine Glättungsmethode besser funktionieren. Wenn Sie nicht mindestens 38 Datenpunkte haben, sollten Sie eine andere Methode als ARIMA beachten. Der erste Schritt bei der Anwendung der ARIMA-Methodik ist die Überprüfung der Stationarität. Stationarity impliziert, dass die Serie auf einem ziemlich konstanten Niveau im Laufe der Zeit bleibt. Wenn ein Trend existiert, wie in den meisten wirtschaftlichen oder geschäftlichen Anwendungen, dann sind Ihre Daten nicht stationär. Die Daten sollten auch eine konstante Varianz in ihren Schwankungen über die Zeit zeigen. Dies ist leicht zu sehen mit einer Serie, die stark saisonal und wächst mit einer schnelleren Rate. In einem solchen Fall werden die Höhen und Tiefen in der Saisonalität im Laufe der Zeit dramatischer werden. Ohne dass diese stationären Bedingungen erfüllt sind, können viele der mit dem Prozess verbundenen Berechnungen nicht berechnet werden. Wenn eine grafische Darstellung der Daten eine Nichtstationarität anzeigt, dann sollten Sie die Serie unterscheiden. Das Unterscheiden ist eine hervorragende Möglichkeit, eine nichtstationäre Serie in eine stationäre zu verwandeln. Dies geschieht durch Subtraktion der Beobachtung in der aktuellen Periode von der vorherigen. Wenn diese Umwandlung nur einmal zu einer Serie erfolgt, sagst du, dass die Daten zuerst differenziert wurden. Dieser Prozess eliminiert im Wesentlichen den Trend, wenn Ihre Serie mit einer konstanten Rate wächst. Wenn es mit zunehmender Rate wächst, können Sie das gleiche Verfahren anwenden und die Daten wieder unterscheiden. Ihre Daten würden dann zweiter differenziert. Autokorrelationen sind Zahlenwerte, die angeben, wie sich eine Datenreihe über die Zeit verhält. Genauer gesagt, es misst, wie stark Datenwerte bei einer bestimmten Anzahl von Perioden auseinander mit der Zeit miteinander korreliert sind. Die Anzahl der Perioden auseinander ist in der Regel die Verzögerung genannt. Beispielsweise misst eine Autokorrelation bei Verzögerung 1, wie die Werte 1 Periode auseinander in der ganzen Reihe miteinander korreliert sind. Eine Autokorrelation bei Verzögerung 2 misst, wie die Daten zwei Perioden voneinander getrennt sind. Autokorrelationen können von 1 bis -1 reichen. Ein Wert nahe 1 gibt eine hohe positive Korrelation an, während ein Wert nahe bei -1 eine hohe negative Korrelation impliziert. Diese Maßnahmen werden am häufigsten durch grafische Darstellungen als Korrelate ausgewertet. Ein Korrektogramm zeichnet die Autokorrelationswerte für eine gegebene Reihe bei verschiedenen Verzögerungen auf. Dies wird als Autokorrelationsfunktion bezeichnet und ist bei der ARIMA-Methode sehr wichtig. Die ARIMA-Methodik versucht, die Bewegungen in einer stationären Zeitreihe als Funktion von sogenannten autoregressiven und gleitenden Durchschnittsparametern zu beschreiben. Diese werden als AR-Parameter (autoregessive) und MA-Parameter (gleitende Durchschnitte) bezeichnet. Ein AR-Modell mit nur 1 Parameter kann als geschrieben werden. X (t) A (1) X (t-1) E (t) wobei X (t) Zeitreihe unter Untersuchung A (1) der autoregressive Parameter der Ordnung 1 X (t-1) die Zeitreihe verzögerte 1 Periode E (T) der Fehlerterm des Modells Dies bedeutet einfach, dass jeder gegebene Wert X (t) durch eine Funktion seines vorherigen Wertes X (t-1) plus einen unerklärlichen Zufallsfehler E (t) erklärt werden kann. Wenn der Schätzwert von A (1) 0,30 betrug, würde der aktuelle Wert der Reihe mit 30 seines Wertes 1 verknüpft sein. Natürlich könnte die Serie auf mehr als nur einen vergangenen Wert bezogen werden. Beispielsweise ist X (t) A (1) X (t-1) A (2) X (t-2) E (t) Dies zeigt an, dass der aktuelle Wert der Reihe eine Kombination der beiden unmittelbar vorhergehenden Werte ist, X (t-1) und X (t-2), plus einige zufällige Fehler E (t). Unser Modell ist jetzt ein autoregressives Modell der Ordnung 2. Moving Average Models: Eine zweite Art von Box-Jenkins-Modell heißt ein gleitendes Durchschnittsmodell. Obwohl diese Modelle dem AR-Modell sehr ähnlich sind, ist das Konzept hinter ihnen ganz anders. Bewegliche Durchschnittsparameter beziehen sich auf das, was in der Periode t nur auf die zufälligen Fehler geschieht, die in vergangenen Zeitperioden aufgetreten sind, dh E (t-1), E (t-2) usw. anstelle von X (t-1), X ( T-2), (Xt-3) wie in den autoregressiven Ansätzen. Ein gleitendes Durchschnittsmodell mit einem MA-Term kann wie folgt geschrieben werden. X (t) - B (1) E (t-1) E (t) Der Ausdruck B (1) heißt MA der Ordnung 1. Das negative Vorzeichen vor dem Parameter wird nur für Konvention verwendet und wird üblicherweise ausgedruckt Automatisch von den meisten Computerprogrammen. Das obige Modell sagt einfach, dass jeder gegebene Wert von X (t) direkt nur mit dem zufälligen Fehler in der vorherigen Periode E (t-1) und dem aktuellen Fehlerterm E (t) zusammenhängt. Wie bei autoregressiven Modellen können die gleitenden Durchschnittsmodelle auf Strukturen höherer Ordnung ausgedehnt werden, die unterschiedliche Kombinationen und gleitende Durchschnittslängen abdecken. Die ARIMA-Methodik ermöglicht auch die Erstellung von Modellen, die sowohl autoregressive als auch gleitende Durchschnittsparameter umfassen. Diese Modelle werden oft als gemischte Modelle bezeichnet. Obwohl dies für ein komplizierteres Vorhersage-Tool macht, kann die Struktur tatsächlich die Serie besser simulieren und eine genauere Prognose erzeugen. Pure Modelle implizieren, dass die Struktur nur aus AR - oder MA-Parametern besteht - nicht beides. Die von diesem Ansatz entwickelten Modelle werden in der Regel als ARIMA-Modelle bezeichnet, weil sie eine Kombination von autoregressiven (AR), Integration (I) - beziehen sich auf den umgekehrten Prozess der Differenzierung, um die Prognose zu produzieren, und gleitende durchschnittliche (MA) Operationen. Ein ARIMA-Modell wird üblicherweise als ARIMA (p, d, q) angegeben. Dies stellt die Reihenfolge der autoregressiven Komponenten (p), die Anzahl der differenzierenden Operatoren (d) und die höchste Ordnung des gleitenden Durchschnittsterms dar. Zum Beispiel bedeutet ARIMA (2,1,1), dass Sie ein autoregressives Modell zweiter Ordnung mit einer gleitenden durchschnittlichen Komponente erster Ordnung haben, deren Serie einmal differenziert wurde, um die Stationarität zu induzieren. Kommissionierung der richtigen Spezifikation: Das Hauptproblem in der klassischen Box-Jenkins versucht zu entscheiden, welche ARIMA-Spezifikation - i. e. Wie viele AR - und MA-Parameter enthalten sind. Dies ist, was viel von Box-Jenkings 1976 dem Identifizierungsprozess gewidmet war. Es hing von der grafischen und numerischen Auswertung der Probenautokorrelation und partiellen Autokorrelationsfunktionen ab. Nun, für Ihre Basismodelle ist die Aufgabe nicht allzu schwierig. Jeder hat Autokorrelationsfunktionen, die eine bestimmte Art und Weise aussehen. Wenn du aber in der Komplexität stehst, sind die Muster nicht so leicht zu erkennen. Um die Sache schwieriger zu machen, stellt Ihre Daten nur eine Stichprobe des zugrunde liegenden Prozesses dar. Dies bedeutet, dass Abtastfehler (Ausreißer, Messfehler usw.) den theoretischen Identifikationsvorgang verzerren können. Das ist der Grund, warum traditionelle ARIMA-Modellierung eine Kunst ist und nicht eine Wissenschaft. ARIMA Vorhersage mit Excel und R Hallo Heute gehe ich Sie durch eine Einführung in das ARIMA-Modell und seine Komponenten sowie eine kurze Erklärung der Box-Jenkins Methode, wie ARIMA-Modelle angegeben sind. Schließlich habe ich eine Excel-Implementierung mit R, die I8217ll zeigen Ihnen, wie Sie einrichten und verwenden. Autoregressive Moving Average (ARMA) Modelle Das Autoregressive Moving Average Modell dient zur Modellierung und Prognose stationärer, stochastischer Zeitreihenprozesse. Es ist die Kombination von zwei zuvor entwickelten statistischen Techniken, den Autoregressiven (AR) und Moving Average (MA) Modellen und wurde ursprünglich von Peter Whittle im Jahre 1951 beschrieben. George E. P. Box und Gwilym Jenkins popularisierten das Modell im Jahr 1971 durch die Festlegung diskreter Schritte zur Modellierung, Schätzung und Überprüfung. Dieser Vorgang wird später als Referenz beschrieben. Wir werden mit der Einführung des ARMA-Modells durch die verschiedenen Komponenten, die AR - und MA-Modelle beginnen und dann eine populäre Verallgemeinerung des ARMA-Modells ARIMA (Autoregressive Integrated Moving Average) und Prognose - und Modellspezifikationsschritte vorstellen. Schließlich werde ich erklären, eine Excel-Implementierung, die ich erstellt und wie man es verwendet, um Ihre Zeitreihe Prognosen zu machen. Autoregressive Modelle Das Autoregressive Modell dient zur Beschreibung von zufälligen Prozessen und zeitveränderlichen Prozessen und gibt an, dass die Ausgangsvariable linear von den bisherigen Werten abhängt. Das Modell wird beschrieben als: Xt c sum varphii, Xt-i varepsilont Wo varphi1, ldots, varphivarphi sind die Parameter des Modells, C ist konstant, und varepsilont ist ein weißer Rauschen Begriff. Im Wesentlichen, was das Modell beschreibt, ist für jeden gegebenen Wert X (t). Es kann durch Funktionen seines vorherigen Wertes erklärt werden. Für ein Modell mit einem Parameter wird varphi 1. X (t) durch seinen vergangenen Wert X (t-1) und den zufälligen Fehler varepsilont erklärt. Für ein Modell mit mehr als einem Parameter, zB varphi 2. X (t) ist gegeben durch X (t-1). X (t-2) und zufälliger Fehler varepsilont. Moving Average Model Das Moving Average (MA) Modell wird oft für die Modellierung von univariaten Zeitreihen verwendet und ist definiert als: Xt mu varepsilont theta1, varepsilon ldots thetaq, varepsilon mu ist der Mittelwert der Zeitreihe. Theta1, ldots, thetaq sind die Parameter des Modells. Varepsilont, varepsilon, ldots sind die weißen Rauschfehler Begriffe. Q ist die Reihenfolge des Moving Average-Modells. Das Moving Average-Modell ist eine lineare Regression des aktuellen Wertes der Serie im Vergleich zu Varepsilont-Terme in der vorherigen Periode, t. Varepsilon Zum Beispiel wird ein MA-Modell von q 1. X (t) durch den aktuellen Fehler varepsilont in der gleichen Periode und den vergangenen Fehlerwert, varepsilon erklärt. Für ein Modell der Ordnung 2 (q 2) wird X (t) durch die beiden letzten Fehlerwerte Varepsilon und Varepsilon erklärt. Die AR (p) und MA (q) Begriffe werden im ARMA-Modell verwendet, das nun eingeführt wird. Autoregressive Moving Average Model Autoregressive Moving Durchschnittliche Modelle verwenden zwei Polynome, AR (p) und MA (q) und beschreiben einen stationären stochastischen Prozess. Ein stationärer Prozeß ändert sich nicht, wenn er in Zeit oder Raum verschoben wird, daher hat ein stationärer Prozeß konstantes Mittel und Varianz. Das ARMA-Modell wird oft in Bezug auf seine Polynome, ARMA (p, q) bezeichnet. Die Notation des Modells ist geschrieben: Xt c varepsilont sum varphi1 X sum thetai varepsilon Das Auswählen, Schätzen und Verifizieren des Modells wird durch den Box-Jenkins-Prozess beschrieben. Box-Jenkins-Methode für die Modellidentifikation Im Folgenden finden Sie einen Überblick über die Box-Jenkins-Methode, da der eigentliche Prozess der Suche nach diesen Werten ohne ein statistisches Paket sehr überwältigend sein kann. Das auf dieser Seite enthaltene Excel-Blatt bestimmt automatisch das passendste Modell. Der erste Schritt der Box-Jenkins-Methode ist die Modellidentifikation. Der Schritt umfasst die Identifizierung der Saisonalität, die Differenzierung bei Bedarf und die Bestimmung der Reihenfolge von p und q durch Auftragen der Autokorrelations - und Teilautokorrelationsfunktionen. Nachdem das Modell identifiziert wurde, schätzt der nächste Schritt die Parameter. Die Parameterschätzung verwendet statistische Pakete und Berechnungsalgorithmen, um die passenden Parameter zu finden. Sobald die Parameter gewählt sind, prüft der letzte Schritt das Modell. Die Modellprüfung erfolgt durch Testen, um zu sehen, ob das Modell einer stationären, univariaten Zeitreihe entspricht. Man sollte auch bestätigen, dass die Residuen unabhängig voneinander sind und ein konstantes Mittel und eine Abweichung über die Zeit aufweisen, was durch die Durchführung eines Ljung-Box-Tests oder nochmals die Autokorrelation und die partielle Autokorrelation der Residuen erfolgen kann. Beachten Sie den ersten Schritt beinhaltet die Überprüfung auf Saisonalität. Wenn die Daten, mit denen Sie arbeiten, saisonale Trends enthält, sind Sie 8220difference8221, um die Daten stationär zu machen. Dieser differenzierende Schritt verallgemeinert das ARMA-Modell in ein ARIMA-Modell oder Autoregressive Integrated Moving Average, wobei 8216Integrated8217 dem differenzierenden Schritt entspricht. Autoregressive integrierte Moving Average Modelle Das ARIMA Modell hat drei Parameter, p, d, q. Um das ARMA-Modell so zu definieren, dass es den differenzierenden Term beinhaltet, beginnen wir mit der Umstellung des Standard-ARMA-Modells, um X (t) Latex und Latex Varepsilont aus der Summation zu trennen. (1 - Summe Alphai Li) Xt (1 Summe thetai Li) varepsilont Wo L der Lagoperator und Alphai ist. Thetai Varepsilont sind autoregressive und gleitende Durchschnittsparameter und die Fehlerbegriffe. Wir nehmen nun die Annahme der ersten Polynom der Funktion, (1 - Summe Alphai Li) hat eine einheitliche Wurzel der Multiplizität d. Wir können es dann folgendermaßen umschreiben: Das ARIMA - Modell drückt die Polynomfaktorisierung mit pp - d aus und gibt uns: (1 - Summe phii Li) (1 - L) d Xt (1 Summe thetai Li) varepsilont Schließlich verallgemeinern wir die Modell weiter durch Hinzufügen eines Drift-Termes, der das ARIMA-Modell als ARIMA (p, d, q) mit Drift frac definiert. (1 - Summe Phii Li) (1 - L) d Xt Delta (1 Summe thetai Li) varepsilont Mit dem nun definierten Modell können wir das ARIMA Modell als zwei getrennte Teile ansehen, ein nicht stationäres und das andere weitgehend stationär (Gemeinsame Wahrscheinlichkeitsverteilung ändert sich nicht, wenn sie in Zeit oder Raum verschoben wird). Das nicht-stationäre Modell: Das weitläufige stationäre Modell: (1 - sum phii Li) Yt (1 sum thetai Li) varepsilont Prognosen können nun auf Yt mit einer generalisierten autoregressiven Prognosemethode gemacht werden. Nun, da wir die ARMA - und ARIMA-Modelle besprochen haben, wenden wir uns nun an, wie können wir sie in praktischen Anwendungen nutzen, um eine Prognose zu liefern. Ive baute eine Implementierung mit Excel mit R, um ARIMA-Prognosen sowie eine Option zum Ausführen von Monte Carlo Simulation auf dem Modell, um die Wahrscheinlichkeit der Prognosen zu bestimmen. Excel-Implementierung und Gebrauchsanweisung Bevor Sie das Blatt verwenden, müssen Sie R und RExcel von der Statconn-Website herunterladen. Wenn du bereits R installiert hast, kannst du einfach RExcel herunterladen. Wenn du nicht R installiert hast, kannst du RAndFriends herunterladen, die die neueste Version von R und RExcel enthält. Bitte beachten Sie, dass RExcel nur auf 32bit Excel für seine nicht kommerzielle Lizenz funktioniert. Wenn Sie 64bit Excel installiert haben, müssen Sie eine kommerzielle Lizenz von Statconn erhalten. Es empfiehlt sich, RAndFriends herunterzuladen, da es für die schnellste und einfachste Installation funktioniert, wenn Sie bereits R haben und es manuell installieren möchten, folgen Sie diesen nächsten Schritten. Manuelles Installieren von RExcel Um RExcel und die anderen Pakete zu installieren, um R in Excel zu arbeiten, öffnen Sie zuerst R als Administrator, indem Sie mit der rechten Maustaste auf die. exe klicken. Installieren Sie in der R-Konsole RExcel, indem Sie die folgenden Anweisungen eingeben: Die obigen Befehle installieren RExcel auf Ihrem Computer. Der nächste Schritt ist, rcom zu installieren, das ist ein anderes Paket von Statconn für das RExcel Paket. Um dies zu installieren, geben Sie die folgenden Befehle ein, die auch rscproxy ab R Version 2.8.0 automatisch installieren. Mit diesen Paketen können Sie auf die Verbindung zwischen R und Excel setzen. Obwohl nicht notwendig, um die Installation, ein praktisches Paket zum Download ist Rcmdr, von John Fox entwickelt. Rcmdr erstellt R-Menüs, die in Excel zu Menüs werden können. Diese Funktion kommt standardmäßig mit der RAndFriends-Installation und macht mehrere R-Befehle in Excel verfügbar. Geben Sie die folgenden Befehle in R ein, um Rcmdr zu installieren. Wir können den Link zu R und Excel erstellen. Hinweis in den letzten Versionen von RExcel wird diese Verbindung mit einem einfachen Doppelklick auf die mitgelieferte. bat-Datei ActivateRExcel2010 gemacht, also musst du nur diese Schritte befolgen, wenn du R und RExcel manuell installiert hast oder wenn aus irgendeinem Grund die Verbindung nicht gemacht wird Die RAndFriends Installation. Erstellen Sie die Verbindung zwischen R und Excel Öffnen Sie ein neues Buch in Excel und navigieren Sie zum Optionsbildschirm. Klicken Sie auf Optionen und dann auf Add-Ins. Sie sollten eine Liste aller aktiven und inaktiven Add-Ins sehen, die Sie derzeit haben. Klicken Sie unten auf die Schaltfläche Go. Im Dialogfeld Add-Ins sehen Sie alle hinzugefügten Add-In-Referenzen. Klicken Sie auf Durchsuchen. Navigieren Sie zum RExcel-Ordner, der sich normalerweise in C: Program FilesRExcelxls befindet oder ähnliches. Finde das RExcel. xla-Add-In und klicke darauf. Der nächste Schritt ist, eine Referenz zu erstellen, damit Makros mit R richtig funktionieren. Geben Sie in Ihrem Excel-Dokument Alt F11 ein. Dies wird eröffnet Excels VBA Editor. Gehen Sie zu Tools - gt Referenzen, und finden Sie die RExcel-Referenz, RExcelVBAlib. RExcel sollte nun bereit sein, mit dem Excel-Blatt zu verwenden Nun, da R und RExcel richtig konfiguriert sind, ist es Zeit, eine Vorhersage zu machen. Öffnen Sie das Prognoseblatt und klicken Sie auf Server laden. Dies ist, um den RCom-Server zu starten und auch die notwendigen Funktionen zu laden, um die Prognose zu machen. Es öffnet sich ein Dialogfenster. Wählen Sie die mitgelieferte Datei itall. R aus. Diese Datei enthält die Funktionen, die das Prognosetool verwendet. Die meisten der enthaltenen Funktionen wurden von Professor Stoffer an der University of Pittsburgh entwickelt. Sie erweitern die Fähigkeiten von R und geben uns einige hilfreiche Diagnosegraphen zusammen mit unserer Prognoseleistung. Es gibt auch eine Funktion, um automatisch die passenden Parameter des ARIMA-Modells zu bestimmen. Nachdem der Server geladen ist, geben Sie Ihre Daten in die Spalte Daten ein. Markieren Sie den Bereich der Daten, klicken Sie mit der rechten Maustaste und wählen Sie Name Bereich. Benennen Sie den Bereich als Daten. Als nächstes legen Sie die Häufigkeit Ihrer Daten in Cell C6 fest. Frequenz bezieht sich auf die Zeiträume Ihrer Daten. Wenn es wöchentlich ist, wäre die Frequenz 7. Monatlich wäre 12, während vierteljährlich 4 sein würde, und so weiter. Geben Sie die voraussichtlichen Fristen ein. Beachten Sie, dass ARIMA-Modelle nach einigen aufeinanderfolgenden Frequenzvorhersagen ziemlich ungenau werden. Eine gute Faustregel ist, nicht mehr als 30 Stufen zu überschreiten, da irgendetwas vorbei, was ziemlich unzuverlässig sein könnte. Das hängt auch von der Größe Ihres Datensatzes ab. Wenn Sie über begrenzte Daten verfügen, empfiehlt es sich, eine kleinere Vorstufe zu wählen. Nach der Eingabe Ihrer Daten, der Benennung und der Einstellung der gewünschten Frequenz und der Vorhersage der Vorhersage klicken Sie auf Ausführen. Es kann eine Weile dauern, bis die Prognose verarbeitet wird. Sobald es fertig ist, erhalten Sie vorhergesagte Werte auf die angegebene Nummer, den Standardfehler der Ergebnisse und zwei Diagramme. Die linke ist die vorhergesagten Werte, die mit den Daten gezeichnet sind, während das Recht eine praktische Diagnostik mit standardisierten Residuen, die Autokorrelation der Residuen, ein gg-Plot der Residuen und ein Ljung-Box-Statistikgraphen enthält, um festzustellen, ob das Modell gut passt. Ich werde nicht zu viel Detail auf, wie Sie für ein gut ausgestattetes Modell suchen, aber auf dem ACF-Diagramm wollen Sie nicht, dass irgendwelche (oder viel) der Lag Spikes über die gepunktete blaue Linie überqueren. Auf der gg-Handlung, je mehr Kreise, die durch die Linie gehen, desto normaler und besser passt das Modell ist. Für größere Datensätze könnte dies eine Menge Kreise überqueren. Schließlich ist der Ljung-Box-Test ein Artikel an sich, aber je mehr Kreise, die über der punktierten blauen Linie liegen, desto besser ist das Modell. Wenn das Diagnoseergebnis nicht gut aussieht, können Sie versuchen, weitere Daten hinzuzufügen oder an einem anderen Punkt näher an den Bereich zu gehen, den Sie prognostizieren möchten. Sie können die erzeugten Ergebnisse ganz einfach löschen, indem Sie auf die Schaltflächen Clear Forecastted Values klicken. Und das ist es derzeit, die Datum Spalte tut nichts anderes als für Ihre Referenz, aber es ist nicht notwendig für das Tool. Wenn ich Zeit finde, komme ich zurück und füge hinzu, dass der angezeigte Graph die richtige Zeit zeigt. Sie können auch einen Fehler beim Ausführen der Prognose erhalten. Dies ist in der Regel aufgrund der Funktion, die findet die besten Parameter ist nicht in der Lage, die richtige Reihenfolge zu bestimmen. Sie können die oben genannten Schritte zu versuchen, um Ihre Daten besser für die Funktion zu arbeiten. Ich hoffe du bekommst die Verwendung aus dem Werkzeug. Es hat mir viel Zeit bei der Arbeit gerettet, denn jetzt muss ich nur noch die Daten eingeben, den Server laden und ausführen. Ich hoffe auch, dass dies zeigt, wie ehrfürchtiges R sein kann, besonders wenn es mit einem Front-End wie Excel benutzt wird. Code, Excel-Arbeitsblatt und. bas-Datei sind auch hier auf GitHub .8.3 Autoregressive Modelle In einem multiplen Regressionsmodell prognostizieren wir die Variable von Interesse mit einer linearen Kombination von Prädiktoren. In einem Autoregressionsmodell prognostizieren wir die Variable von Interesse mit einer linearen Kombination von vergangenen Werten der Variablen. Der Begriff auto regression zeigt an, dass es sich um eine Regression der Variablen gegen sich selbst handelt. So kann ein autoregressives Modell der Ordnung p geschrieben werden, wo c eine Konstante ist und et ist weißes Rauschen. Dies ist wie eine multiple Regression, aber mit verzögerten Werten von yt als Prädiktoren. Wir bezeichnen dies als AR (p) Modell. Autoregressive Modelle sind bemerkenswert flexibel bei der Handhabung einer Vielzahl von verschiedenen Zeitreihenmuster. Die beiden Serien in Abbildung 8.5 zeigen Serien aus einem AR (1) Modell und einem AR (2) Modell. Das Ändern der Parameter phi1, dots, phip ergibt sich in verschiedenen Zeitreihenmustern. Die Varianz des Fehlerterms und wird nur die Skala der Serie ändern, nicht die Muster. Abbildung 8.5: Zwei Beispiele von Daten aus autoregressiven Modellen mit unterschiedlichen Parametern. Links: AR (1) mit yt 18 -0.8y et. Rechts: AR (2) mit yt 8 1.3y -0.7y et. In beiden Fällen ist et normal verteilt weißes Rauschen mit mittlerem Null und Varianz eins. Für ein AR (1) Modell: Wenn phi10, yt entspricht weißes Rauschen. Wenn phi11 und c0, yt gleichbedeutend mit einem zufälligen Spaziergang ist. Wenn phi11 und cne0, yt ist gleichbedeutend mit einem zufälligen Spaziergang mit Drift Wenn phi1lt0, yt neigt dazu, zwischen positiven und negativen Werten oszillieren. Normalerweise beschränken wir autoregressive Modelle auf stationäre Daten, und dann sind einige Einschränkungen für die Werte der Parameter erforderlich. Für ein AR (1) Modell: -1 lt phi1 lt 1. Für ein AR (2) Modell: -1 lt phi2 lt 1, phi1phi2 lt 1, phi2-phi1 lt 1. Wenn pge3 die Einschränkungen viel komplizierter sind. R kümmert sich um diese Einschränkungen bei der Schätzung eines Modells.
No comments:
Post a Comment