Saturday 28 October 2017

Autoregressiver Gleitender Durchschnitt Für Dummies


Univariate Zeitreihen-Daten-Daten-Wissenschaft für Dummies Ähnlich wie multivariate Analyse die Analyse von Beziehungen zwischen mehreren Variablen ist, ist die univariate Analyse eine quantitative Analyse nur einer Variablen. Wenn Sie univariate Zeitreihen modellieren, modellieren Sie Zeitreihenänderungen, die Änderungen in einer einzelnen Variablen über die Zeit darstellen. Autoregressive Moving Average (ARMA) ist eine Klasse von Prognosemethoden, mit denen Sie zukünftige Werte aus aktuellen und historischen Daten vorhersagen können. Wie der Name schon sagt, kombiniert die Familie der ARMA-Modelle Autoregressionstechniken (Analysen, die voraussetzen, dass frühere Beobachtungen gute Prädiktoren für zukünftige Werte darstellen und eine Autoregressionsanalyse durchführen, um diese zukünftigen Werte vorherzusagen) und gleitenden Durchschnittstechniken 8212-Modelle Konstanten Zeitreihen und aktualisieren Sie dann das Prognosemodell, wenn Änderungen erkannt werden. Hier ist ein Beispiel für eine Gleichung für das ARMA-Modell: In dieser Gleichung entspricht y t dem tatsächlichen Wert der Zeitreihe zum Zeitpunkt t. Y t 8211 y t 8208 1 entspricht der Nettoänderung des Zeitwertwerts zwischen Zeit t und Zeit t 8211 1 8212 die Änderung des Wertes der Zeitreihe über ein Zeitintervall, mit anderen Worten. E t 8208 1 entspricht dem Fehlerterm zum Zeitpunkt t 8211 1 (eine Quantifizierung der Fehlerprozesse im Modell zum Zeitpunkt t 8211 1). Die Autoregression geht davon aus, dass die bisherigen p-Beobachtungen in den Zeitreihen eine gute Schätzung künftiger Beobachtungen liefern. Der gleitende Mittelteil des Modells ermöglicht es dem Modell, die Prognosen zu aktualisieren, wenn sich der Pegel einer konstanten Zeitreihe ändert. Wenn Sie auf der Suche nach einem einfachen Modell oder einem Modell, das nur für eine kleine Datenmenge arbeiten wird, dann ist das ARMA-Modell nicht eine gute Passform für Ihre Bedürfnisse. Eine Alternative in diesem Fall wäre, nur mit einfachen linearen Regression Stick. Um das ARMA-Modell für zuverlässige Ergebnisse zu verwenden, müssen Sie mindestens 50 Beobachtungen und einen ausgebildeten Analytiker haben, der das Modell für Sie passen und interpretieren kann. Die Abbildung zeigt ein Diagramm des ARMA-Modells, das dieser Gleichung entspricht: In der Abbildung sehen Sie, dass die Modellprognosedaten und die tatsächlichen Daten sehr gut passen. Dies bedeutet, dass die Gleichung, die oben formuliert ist eine gute Darstellung der Zeitreihen es models. I bin wirklich versuchen, aber kämpfen, zu verstehen, wie Autoregressive und Moving Average arbeiten. Ich bin ziemlich schrecklich mit Algebra und Blick auf es nicht wirklich verbessern mein Verständnis von etwas. Was ich wirklich lieben würde, ist ein extrem einfaches Beispiel für 10 zeitabhängige Beobachtungen, damit ich sehen kann, wie sie funktionieren. So können Sie sagen, dass Sie die folgenden Datenpunkte des Goldpreises haben: Zum Beispiel, was wäre der Moving Average von Lag 2, MA (2), oder MA (1) und AR (1) oder AR (2) Ich lernte traditionell über Moving Average so etwas wie: Aber wenn man ARMA-Modelle betrachtet, wird MA als eine Funktion der vorherigen Fehler-Begriffe erklärt, die ich nicht bekommen kann meinen Kopf. Ist es nur eine fancier Art und Weise der Berechnung der gleiche Sache fand ich diesen Beitrag hilfreich: (Wie SARIMAX intuitiv zu verstehen), aber Whist die Algebra hilft, kann ich nicht sehen, etwas wirklich klar, bis ich ein vereinfachtes Beispiel davon zu sehen. Angesichts der Goldpreisdaten, würden Sie zunächst schätzen das Modell und dann sehen, wie es funktioniert (Impulsantwort-Prognosen). Vielleicht sollten Sie verengen Sie Ihre Frage nur auf den zweiten Teil (und verlassen Schätzung beiseite). Das heißt, Sie würden ein AR (1) oder MA (1) oder was auch immer Modell (z. B. xt0.5 x varepsilont) und fragen Sie uns, wie funktioniert dieses Modell arbeiten. Ndash Richard Hardy Für jedes AR (q) - Modell ist der einfache Weg, um die Parameter (s) zu schätzen ist OLS verwenden - und führen Sie die Regression von: pricet beta0 beta1 cdot Preis dotso betaq cdot Preis Lets do so (In R): (Okay, also ich betrogen ein wenig und verwendet die Arima-Funktion in R, aber es liefert die gleichen Schätzungen wie die OLS-Regression - versuchen Sie es). Nun kann man sich das MA (1) - Modell ansehen. Jetzt unterscheidet sich das MA-Modell vom AR-Modell. Der MA ist gewichteter Durchschnitt von Fehlern der Vergangenheit, wobei, da das AR-Modell die vorherigen Perioden die tatsächlichen Datenwerte verwendet. Der MA (1) ist: pricet mu wt theta1 cdot w Wo mu der Mittelwert ist und wt die Fehlerterme sind - nicht der previoes-Wert des Preises (wie im AR-Modell). Nun, leider, können wir nicht schätzen die Parameter durch etwas so einfach wie OLS. Ich werde nicht die Methode hier decken, aber die R-Funktion arima verwendet maximale likihood. Lets try: Hoffe, das hilft. (2) Was die Frage MA (1) betrifft. Sie sagen, der Rest ist 1.0023 für den zweiten Zeitraum. Das macht Sinn. Mein Verständnis des Restes ist die Differenz zwischen dem prognostizierten Wert und dem beobachteten Wert. Aber du sagst dann den prognostizierten Wert für Periode 2, wird mit dem Restwert für Periode 2 berechnet. Ist das richtig Isn39t der prognostizierte Wert für Periode 2 nur (0.54230 4.9977) ndash Will TE Aug 17 15 um 11: 24A RIMA steht für Autoregressive Integrated Gleitende Durchschnittsmodelle. Univariate (Einzelvektor) ARIMA ist eine Prognosemethode, die die zukünftigen Werte einer Serie, die vollständig auf ihrer eigenen Trägheit basiert, projiziert. Seine Hauptanwendung liegt im Bereich der kurzfristigen Prognose mit mindestens 40 historischen Datenpunkten. Es funktioniert am besten, wenn Ihre Daten eine stabile oder konsistente Muster im Laufe der Zeit mit einem Minimum an Ausreißern zeigt. Manchmal nennt man Box-Jenkins (nach den ursprünglichen Autoren), ARIMA ist in der Regel überlegen exponentielle Glättung Techniken, wenn die Daten relativ lange und die Korrelation zwischen vergangenen Beobachtungen ist stabil. Wenn die Daten kurz oder stark flüchtig sind, kann eine gewisse Glättungsmethode besser ablaufen. Wenn Sie nicht über mindestens 38 Datenpunkte verfügen, sollten Sie eine andere Methode als ARIMA betrachten. Der erste Schritt bei der Anwendung der ARIMA-Methodik ist die Überprüfung der Stationarität. Stationarität impliziert, dass die Reihe auf einem ziemlich konstanten Niveau über Zeit bleibt. Wenn ein Trend besteht, wie in den meisten wirtschaftlichen oder geschäftlichen Anwendungen, dann sind Ihre Daten nicht stationär. Die Daten sollten auch eine konstante Varianz in ihren Schwankungen im Laufe der Zeit zeigen. Dies ist leicht zu sehen mit einer Serie, die stark saisonal und wächst mit einer schnelleren Rate. In einem solchen Fall werden die Höhen und Tiefen der Saisonalität im Laufe der Zeit dramatischer. Ohne dass diese Stationaritätsbedingungen erfüllt sind, können viele der mit dem Prozess verbundenen Berechnungen nicht berechnet werden. Wenn eine grafische Darstellung der Daten Nichtstationarität anzeigt, dann sollten Sie die Serie unterscheiden. Die Differenzierung ist eine hervorragende Möglichkeit, eine nichtstationäre Serie in eine stationäre zu transformieren. Dies geschieht durch Subtrahieren der Beobachtung in der aktuellen Periode von der vorherigen. Wenn diese Transformation nur einmal zu einer Reihe erfolgt, sagen Sie, dass die Daten zuerst unterschieden wurden. Dieser Prozess im Wesentlichen eliminiert den Trend, wenn Ihre Serie wächst mit einer ziemlich konstanten Rate. Wenn es mit steigender Rate wächst, können Sie das gleiche Verfahren anwenden und die Daten erneut differenzieren. Ihre Daten würden dann zweite differenziert werden. Autokorrelationen sind Zahlenwerte, die angeben, wie sich eine Datenreihe mit der Zeit auf sich bezieht. Genauer gesagt misst es, wie stark Datenwerte bei einer bestimmten Anzahl von Perioden auseinander über die Zeit miteinander korreliert werden. Die Anzahl der Perioden wird in der Regel als Verzögerung bezeichnet. Zum Beispiel misst eine Autokorrelation bei Verzögerung 1, wie die Werte 1 Periode auseinander in der Reihe miteinander korreliert sind. Eine Autokorrelation bei Verzögerung 2 misst, wie die Daten, die zwei Perioden voneinander entfernt sind, über die gesamte Reihe korreliert werden. Autokorrelationen können im Bereich von 1 bis -1 liegen. Ein Wert nahe 1 gibt eine hohe positive Korrelation an, während ein Wert nahe -1 impliziert eine hohe negative Korrelation. Diese Maßnahmen werden meist durch grafische Darstellungen, sogenannte Korrelagramme, ausgewertet. Ein Korrelationsdiagramm zeigt die Autokorrelationswerte für eine gegebene Reihe bei unterschiedlichen Verzögerungen. Dies wird als Autokorrelationsfunktion bezeichnet und ist bei der ARIMA-Methode sehr wichtig. Die ARIMA-Methodik versucht, die Bewegungen in einer stationären Zeitreihe als Funktion der so genannten autoregressiven und gleitenden Durchschnittsparameter zu beschreiben. Diese werden als AR-Parameter (autoregessiv) und MA-Parameter (gleitende Mittelwerte) bezeichnet. Ein AR-Modell mit nur einem Parameter kann als geschrieben werden. X (t) A (1) X (t-1) E (t) wobei X (t) Zeitreihen A (1) der autoregressive Parameter der Ordnung 1 X (t-1) (T) der Fehlerterm des Modells Dies bedeutet einfach, dass jeder gegebene Wert X (t) durch eine Funktion seines vorherigen Wertes X (t-1) plus einen unerklärlichen Zufallsfehler E (t) erklärt werden kann. Wenn der geschätzte Wert von A (1) 0,30 betrug, dann wäre der aktuelle Wert der Reihe mit 30 seines vorherigen Wertes 1 verknüpft. Natürlich könnte die Serie auf mehr als nur einen vergangenen Wert bezogen werden. Zum Beispiel ist X (t) A (1) X (t-1) A (2) X (t-2) E (t) Dies zeigt an, dass der aktuelle Wert der Reihe eine Kombination der beiden unmittelbar vorhergehenden Werte ist, X (t-1) und X (t-2) zuzüglich eines Zufallsfehlers E (t). Unser Modell ist nun ein autoregressives Modell der Ordnung 2. Moving Average Models: Eine zweite Art von Box-Jenkins-Modell wird als gleitendes Durchschnittsmodell bezeichnet. Obwohl diese Modelle dem AR-Modell sehr ähnlich sind, ist das Konzept dahinter ganz anders. Bewegliche Durchschnittsparameter beziehen sich auf das, was in der Periode t stattfindet, nur auf die zufälligen Fehler, die in vergangenen Zeitperioden aufgetreten sind, dh E (t-1), E (t-2) usw. anstatt auf X (t-1), X T-2), (Xt-3) wie in den autoregressiven Ansätzen. Ein gleitendes Durchschnittsmodell mit einem MA-Begriff kann wie folgt geschrieben werden. X (t) - B (1) E (t-1) E (t) Der Begriff B (1) wird als MA der Ordnung 1 bezeichnet. Das negative Vorzeichen vor dem Parameter wird nur für Konventionen verwendet und in der Regel ausgedruckt Automatisch von den meisten Computerprogrammen. Das obige Modell sagt einfach, dass jeder gegebene Wert von X (t) direkt nur mit dem Zufallsfehler in der vorherigen Periode E (t-1) und mit dem aktuellen Fehlerterm E (t) zusammenhängt. Wie im Fall von autoregressiven Modellen können die gleitenden Durchschnittsmodelle auf übergeordnete Strukturen mit unterschiedlichen Kombinationen und gleitenden mittleren Längen erweitert werden. Die ARIMA-Methodik erlaubt es auch, Modelle zu erstellen, die sowohl autoregressive als auch gleitende Durchschnittsparameter zusammenführen. Diese Modelle werden oft als gemischte Modelle bezeichnet. Obwohl dies für eine kompliziertere Prognose-Tool macht, kann die Struktur tatsächlich simulieren die Serie besser und produzieren eine genauere Prognose. Pure Modelle implizieren, dass die Struktur nur aus AR oder MA-Parameter besteht - nicht beides. Die Modelle, die von diesem Ansatz entwickelt werden, werden in der Regel als ARIMA-Modelle bezeichnet, da sie eine Kombination aus autoregressiver (AR), Integration (I) verwenden, die sich auf den umgekehrten Prozess der Differenzierung bezieht, um die Prognose zu erzeugen. Ein ARIMA-Modell wird üblicherweise als ARIMA (p, d, q) angegeben. Dies ist die Reihenfolge der autoregressiven Komponenten (p), der Anzahl der differenzierenden Operatoren (d) und der höchsten Ordnung des gleitenden Mittelwerts. Beispielsweise bedeutet ARIMA (2,1,1), dass Sie ein autoregressives Modell zweiter Ordnung mit einer ersten gleitenden Durchschnittskomponente haben, deren Serie einmal differenziert wurde, um die Stationarität zu induzieren. Auswahl der richtigen Spezifikation: Das Hauptproblem in der klassischen Box-Jenkins versucht zu entscheiden, welche ARIMA-Spezifikation zu verwenden - i. e. Wie viele AR - und / oder MA-Parameter einzuschließen sind. Dies ist, was viel von Box-Jenkings 1976 dem Identifikationsprozeß gewidmet wurde. Es hing von der graphischen und numerischen Auswertung der Stichprobenautokorrelation und der partiellen Autokorrelationsfunktionen ab. Nun, für Ihre grundlegenden Modelle, ist die Aufgabe nicht allzu schwierig. Jeder hat Autokorrelationsfunktionen, die eine bestimmte Weise aussehen. Allerdings, wenn Sie gehen in der Komplexität, die Muster sind nicht so leicht zu erkennen. Um es schwieriger zu machen, stellen Ihre Daten nur eine Probe des zugrundeliegenden Prozesses dar. Das bedeutet, dass Stichprobenfehler (Ausreißer, Messfehler etc.) den theoretischen Identifikationsprozess verzerren können. Deshalb ist die traditionelle ARIMA-Modellierung eher eine Kunst als eine Wissenschaft.

No comments:

Post a Comment