Thursday, 9 February 2017

Formule De Prévision Moyenne Mobile Simple

Spreadsheet implémentation de l'ajustement saisonnier et lissage exponentiel Il est facile d'effectuer un ajustement saisonnier et d'ajuster les modèles de lissage exponentielle en utilisant Excel. Les images et diagrammes d'écran ci-dessous sont tirés d'une feuille de calcul qui a été configurée pour illustrer l'ajustement saisonnier multiplicatif et le lissage exponentiel linéaire sur les données de ventes trimestrielles suivantes de Outboard Marine: Pour obtenir une copie du fichier de feuille de calcul lui-même, cliquez ici. La version de lissage linéaire exponentielle qui sera utilisée ici à des fins de démonstration est la version Brown8217s, simplement parce qu'elle peut être implémentée avec une seule colonne de formules et qu'il n'y a qu'une seule constante de lissage à optimiser. Habituellement, il est préférable d'utiliser la version Holt8217s qui dispose de constantes de lissage distinctes pour le niveau et la tendance. Le processus de prévision se déroule comme suit: (i) d'abord les données sont désaisonnalisées (ii) ensuite les prévisions sont générées pour les données désaisonnalisées par lissage exponentiel linéaire et (iii) enfin les prévisions désaisonnalisées sont quasiment saisonnalisées pour obtenir des prévisions pour la série originale . Le processus d'ajustement saisonnier est effectué dans les colonnes D à G. La première étape de l'ajustement saisonnier est de calculer une moyenne mobile centrée (effectuée ici dans la colonne D). Cela peut se faire en prenant la moyenne de deux moyennes sur une année qui sont compensées par une période l'une par rapport à l'autre. (Une combinaison de deux moyennes de décalage plutôt qu'une moyenne simple est nécessaire pour des fins de centrage lorsque le nombre de saisons est pair.) L'étape suivante consiste à calculer le rapport à la moyenne mobile - ie. Les données originales sont divisées par la moyenne mobile dans chaque période - ce qui est réalisé ici dans la colonne E. (On appelle également cette composante du cycle quottrend-cycle, dans la mesure où les effets de tendance et de cycle d'affaires peuvent être considérés comme étant tout ce que Il est évident que les variations mensuelles qui ne sont pas dues à la saisonnalité pourraient être déterminées par de nombreux autres facteurs, mais la moyenne sur douze mois les lisse dans une large mesure. L'indice saisonnier estimé pour chaque saison est calculé en faisant la moyenne d'abord de tous les ratios pour cette saison particulière, qui est effectuée dans les cellules G3-G6 en utilisant une formule AVERAGEIF. Les ratios moyens sont alors redimensionnés de sorte qu'ils totalisent exactement 100 fois le nombre de périodes dans une saison, ou 400 dans ce cas, ce qui est fait dans les cellules H3-H6. Dans la colonne F, les formules VLOOKUP sont utilisées pour insérer la valeur d'indice saisonnier appropriée dans chaque ligne du tableau de données, en fonction du trimestre de l'année où il est représenté. La moyenne mobile centrée et les données désaisonnalisées se terminent comme suit: Notez que la moyenne mobile ressemble généralement à une version plus lisse de la série désaisonnalisée et qu'elle est plus courte aux deux extrémités. Une autre feuille de calcul dans le même fichier Excel montre l'application du modèle de lissage exponentiel linéaire aux données désaisonnalisées, commençant dans la colonne G. Une valeur pour la constante de lissage (alpha) est entrée au-dessus de la colonne de prévision (ici, dans la cellule H9) et Pour plus de commodité, on lui attribue le nom de la plage quotAlpha. quot (Le nom est attribué à l'aide de la commande quotInsertNameCreatequot). Le modèle LES est initialisé en définissant les deux premières prévisions égales à la première valeur réelle de la série désaisonnalisée. La formule utilisée ici pour la prévision des LES est la forme récursive à une seule équation du modèle Brown8217s: Cette formule est entrée dans la cellule correspondant à la troisième période (ici, cellule H15) et copiée à partir de là. On remarque que les prévisions ERP pour la période courante se réfèrent aux deux observations précédentes et aux deux erreurs de prévision précédentes, ainsi qu'à la valeur de alpha. Ainsi, la formule de prévision de la rangée 15 se réfère uniquement aux données qui étaient disponibles dans la rangée 14 et antérieures. (Bien sûr, si on voulait utiliser le lissage exponentiel linéaire plutôt que linéaire, nous pourrions remplacer la formule SES ici.) On pourrait aussi utiliser Holt8217s plutôt que le modèle LES de Brown8217, ce qui nécessiterait deux colonnes supplémentaires de formules pour calculer le niveau et la tendance Qui sont utilisés dans la prévision). Les erreurs sont calculées dans la colonne suivante (ici, colonne J) en soustrayant les prévisions des valeurs réelles. L'erreur quadratique moyenne est calculée comme étant la racine carrée de la variance des erreurs plus le carré de la moyenne. (Cela résulte de l'identité mathématique: VARIANCE MSE (erreurs) (MOYENNE (erreurs)) 2). Dans le calcul de la moyenne et de la variance des erreurs dans cette formule, les deux premières périodes sont exclues parce que le modèle ne commence effectivement à prévoir que La troisième période (ligne 15 sur le tableur). La valeur optimale de alpha peut être trouvée soit en changeant manuellement alpha jusqu'à ce que le RMSE minimum soit trouvé, soit vous pouvez utiliser le quotSolverquot pour effectuer une minimisation exacte. La valeur de alpha que le Solver a trouvée est affichée ici (alpha0.471). C'est généralement une bonne idée de tracer les erreurs du modèle (en unités transformées) et aussi de calculer et de tracer leurs autocorrélations à des décalages de jusqu'à une saison. Voici une courbe chronologique des erreurs (désaisonnalisées): Les autocorrélations d'erreur sont calculées à l'aide de la fonction CORREL () pour calculer les corrélations des erreurs avec elles-mêmes retardées par une ou plusieurs périodes - les détails sont affichés dans le modèle de feuille de calcul . Voici une trame des autocorrélations des erreurs aux cinq premiers décalages: Les autocorrélations aux intervalles 1 à 3 sont très proches de zéro, mais la pointe au retard 4 (dont la valeur est 0,35) est légèrement gênante - elle suggère que la Le processus d'ajustement saisonnier n'a pas été complètement réussi. Cependant, il n'est en fait que marginalement significatif. 95 pour déterminer si les autocorrélations sont significativement différentes de zéro sont approximativement plus-ou-moins 2SQRT (n-k), où n est la taille de l'échantillon et k le retard. Ici n est 38 et k varie de 1 à 5, donc la racine carrée de - n-moins-k est d'environ 6 pour tous, et donc les limites pour tester la signification statistique des écarts à partir de zéro sont plus ou moins plus - Ou-moins 26 ou 0,33. Si vous modifiez la valeur de l'alpha à la main dans ce modèle Excel, vous pouvez observer l'effet sur la série temporelle et les diagrammes d'autocorrélation des erreurs, ainsi que sur l'erreur quadratique moyenne qui sera illustrée ci-dessous. Au bas de la feuille de calcul, la formule de prévision est quotbootstrappée à l'avenir en substituant simplement les prévisions aux valeurs réelles au point où les données réelles s'épuisent, c'est-à-dire. Où l'avenir commence. (En d'autres termes, dans chaque cellule où une future valeur de données se produirait, une référence de cellule est insérée qui pointe vers la prévision faite pour cette période.) Toutes les autres formules sont simplement copiées vers le bas depuis le dessus: Notez que les erreurs pour les prévisions de L'avenir sont tous calculés à zéro. Cela ne signifie pas que les erreurs réelles seront nulles, mais plutôt que cela reflète simplement le fait qu'à des fins de prédiction, nous supposons que les données futures seront égales aux prévisions en moyenne. Les prévisions des ERP résultant pour les données désaisonnalisées ressemblent à ceci: Avec cette valeur particulière de alpha, qui est optimale pour les prévisions à une période d'avance, la tendance projetée est légèrement à la hausse, reflétant la tendance locale qui a été observée au cours des 2 dernières années Ou plus. Pour d'autres valeurs d'alpha, une projection de tendance très différente pourrait être obtenue. C'est généralement une bonne idée de voir ce qui arrive à la projection de tendance à long terme lorsque alpha est varié, parce que la valeur qui est la meilleure pour la prévision à court terme ne sera pas nécessairement la meilleure valeur pour prédire l'avenir plus lointain. Par exemple, voici le résultat obtenu si la valeur de alpha est réglée manuellement à 0.25: La tendance à long terme projetée est maintenant négative plutôt que positive Avec une plus petite valeur d'alpha, le modèle place plus de poids sur les données plus anciennes Son estimation du niveau et de la tendance actuels et ses prévisions à long terme reflètent la tendance à la baisse observée au cours des cinq dernières années plutôt que la tendance à la hausse plus récente. Ce diagramme illustre également clairement comment le modèle avec une plus petite valeur d'alpha est plus lent à répondre aux points de quotturning dans les données et tend donc à faire une erreur du même signe pendant de nombreuses périodes d'affilée. Ses erreurs de prévision à 1 pas sont plus élevées en moyenne que celles obtenues avant (RMSE de 34,4 plutôt que 27,4) et fortement positivement autocorrélées. L'autocorrélation lag-1 de 0,56 dépasse de beaucoup la valeur de 0,33 calculée ci-dessus pour un écart statistiquement significatif par rapport à zéro. Comme alternative à la réduction de la valeur de l'alpha afin d'introduire plus de conservatisme dans les prévisions à long terme, un facteur quottrend d'amortissement est parfois ajouté au modèle afin de rendre la tendance projetée aplatir après quelques périodes. La dernière étape de la construction du modèle de prévision consiste à quantifier les prévisions ERP en les multipliant par les indices saisonniers appropriés. Ainsi, les prévisions saisonnières de la colonne I ne sont que le produit des indices saisonniers de la colonne F et des prévisions des prévisions saisonnières corrigées des variations saisonnières dans la colonne H. Il est relativement facile de calculer les intervalles de confiance pour les prévisions à une étape de ce modèle: Calculer le RMSE (erreur quadratique moyenne équivaut à la racine carrée du MSE), puis calculer un intervalle de confiance pour la prévision désaisonnalisée en ajoutant et en soustrayant deux fois le RMSE. (En général, un intervalle de confiance de 95 pour une prévision à une période d'avance est approximativement égal à la prévision de point plus ou moins deux fois l'écart type estimé des erreurs de prévision, en supposant que la distribution des erreurs est approximativement normale et que la taille de l'échantillon Est assez grand, disons, 20 ou plus. Ceci, le RMSE plutôt que l'écart type de l'échantillon des erreurs est la meilleure estimation de l'écart-type des erreurs de prévisions futures car il prend le biais ainsi que les variations aléatoires en compte.) Les limites de confiance Pour les prévisions corrigées des variations saisonnières sont ensuite recalées. Ainsi que les prévisions, en les multipliant par les indices saisonniers appropriés. Dans ce cas, le RMSE est égal à 27,4 et la prévision désaisonnalisée pour la première période future (décembre 93) est de 273,2. De sorte que l'intervalle de confiance corrigé des variations saisonnières est de 273,2-227,4 218,4 à 273,227,4 328,0. Multipliant ces limites par Decembers indice saisonnier de 68,61. Nous obtenons des limites de confiance inférieures et supérieures de 149,8 et 225,0 autour de la prévision ponctuelle de 187,4 déc-93. Les limites de confiance pour les prévisions plus d'une période à venir s'élargiront généralement à mesure que l'horizon de prévision augmente, en raison de l'incertitude concernant le niveau et la tendance ainsi que les facteurs saisonniers, mais il est difficile de les calculer en général par des méthodes analytiques. (La méthode appropriée pour calculer les limites de confiance pour la prévision des ERI est en utilisant la théorie ARIMA, mais l'incertitude dans les indices saisonniers est une autre question.) Si vous voulez un intervalle de confiance réaliste pour une prévision plus d'une période à venir, en prenant toutes les sources de , Il vaut mieux utiliser des méthodes empiriques: par exemple, pour obtenir un intervalle de confiance pour une prévision à deux étapes, vous pouvez créer une autre colonne sur le tableur pour calculer une prévision à deux étapes pour chaque période ( En amorçant la prévision en une étape). Calculez ensuite le RMSE des erreurs de prévision en 2 étapes et utilisez-le comme base pour un intervalle de confiance à 2 étapes. Moyenne mobile pondérée dans l'exemple 1 de la prévision moyenne mobile simple. Les poids donnés aux trois valeurs précédentes étaient tous égaux. Nous considérons maintenant le cas où ces poids peuvent être différents. Ce type de prévision est appelé moyenne mobile pondérée. Ici nous assignons m poids w 1. , W m. Où w 1. W m 1 et définir les valeurs prévues comme suit Exemple 1. Répéter l'exemple 1 de la moyenne mobile simple Prévision où l'on suppose que les observations plus récentes sont pondérées plus que les observations plus anciennes, en utilisant les poids w 1 .6, w 2 .3 et w 3 .1 (comme montré dans la plage G4: G6 de la figure 1 ). Figure 1 Moyennes mobiles pondérées Les formules de la figure 1 sont les mêmes que celles de la figure 1 de la prévision moyenne mobile simple. Sauf pour les valeurs de y prévues dans la colonne C. La formule dans la cellule C7 est maintenant SUMPRODUCT (B4: B6, G4: G6). La prévision de la prochaine valeur dans la série temporelle est maintenant 81.3 (cellule C19), en utilisant la formule SUMPRODUCT (B16: B18, G4: G6). Outil d'analyse de données sur les statistiques réelles. Excel ne fournit pas d'outil d'analyse de données pondérées des moyennes mobiles. Vous pouvez plutôt utiliser l'outil d'analyse des données des moyennes mobiles pondérées des statistiques réelles. Pour utiliser cet outil pour l'exemple 1, appuyez sur Ctr-m. Choisissez l'option Séries chronologiques dans le menu principal, puis l'option Méthodes de prévision de base dans la boîte de dialogue qui s'affiche. Remplissez la boîte de dialogue qui apparaît comme le montre la Figure 5 de la prévision Moyenne mobile simple. Mais cette fois, choisissez l'option Moyennes mobiles pondérées et remplissez la plage de poids avec G4: G6 (notez qu'aucun titre de colonne n'est inclus pour la plage de pondération). Aucune des valeurs de paramètre n'est utilisée (essentiellement de Lags sera le nombre de lignes dans la plage de poids et de saisons et de prévisions par défaut à 1). La sortie ressemblera à la sortie de la Figure 2 de la prévision moyenne mobile simple. Sauf que les poids seront utilisés pour calculer les valeurs prévisionnelles. Exemple 2. Utilisez Solveur pour calculer les poids qui produisent l'erreur quadratique moyenne la plus faible. À l'aide des formules de la figure 1, sélectionnez Data gt AnalysisSolver et remplissez la boîte de dialogue comme indiqué dans la Figure 2. Figure 2 Boîte de dialogue Solver Notez que nous devons limiter la somme des poids à 1, ce que nous faisons en cliquant sur Ajouter un bouton. Cela ouvre la boîte de dialogue Ajouter contrainte, que nous remplissons comme indiqué dans la figure 3, puis cliquez sur le bouton OK. Figure 3 Boîte de dialogue Ajouter une contrainte Nous allons ensuite cliquer sur le bouton Résoudre (sur la Figure 2), qui modifie les données de la Figure 1 comme le montre la Figure 4. Figure 4 Optimisation du Solveur Comme le montre la Figure 4, Solver change les pondérations à 0 223757 et .776243 afin de minimiser la valeur de MSE. Comme vous pouvez le voir, la valeur minimisée de 184.688 (cellule E21 de la figure 4) est au moins inférieure à la valeur MSE de 191.366 dans la cellule E21 de la figure 2). Pour verrouiller ces poids, vous devez cliquer sur le bouton OK de la boîte de dialogue Résultats du Solveur illustrée à la Figure 4.


No comments:

Post a Comment