s
19 708 Pages

un corrélogramme, ou autocorrelogramma, Il est un graphique qui représente la autocorrelation un séries chronologiques en fonction du retard avec lequel on calcule l'autocorrélation.

Calcul des valeurs

un séries chronologiques est un ensemble de valeurs qu'un phénomène donné suppose à des instants successifs ou périodes de temps (le prix d'un titre à la fermeture de jours successifs de sac à main, PIB produit au cours des trimestres ou années, etc.).

indiquant avec Y le phénomène et t un indice variable de 1 à T (Respectivement, le premier et le dernier instant ou période), une série de temps est indiquée par une notation telle que la suivante:

Par rapport à lui, il dit en retard la série dans une nouvelle variable, par exemple, Z, de telle sorte que:

k est la quantité de retard. Par exemple, placer k = 3, si Yà Il est le PIB italien en 2007, Zà Il est le PIB italien en 2004.

Pour construire un corrélogramme, nous examinons la corrélations entre les séries historiques et les séries plus de retard k périodes; Par exemple, compte tenu de la série

construit idéalement une table comme celle-ci, dans lequel K Il indique la valeur maximale de k:

         
       
     
   

et examine la K corrélations entre la colonne Yt et chacun des K colonnes Yt-k.

Vous voyez que si k = 1, la première valeur de la série originale ne peut pas être comparée à une valeur correspondante de la série retardée (ce qui peut ne pas contenir une valeur Y1-1=Y0) Si k = 2 cela se produit pour les deux premières valeurs (les valeurs n'existent pas Y1-2=Y-1, Y2-2=Y0). Normalement, alors:

  • il commence toujours par (K+1) ième ligne, même lorsque la série originale est comparée avec des séries de retard plus faible de la valeur maximale, de manière à toujours comparer série de longueur égale; par exemple, si K = 20 la série retardées ont de 1 à 20 des valeurs inférieures à la série originale, mais il commence à partir de la vingt et unième ligne et pour tous, même pour ceux qui ont des valeurs dans les lignes précédentes, de manière à toujours comparer T-20 paires de valeurs;
  • K, la valeur maximale de k, Il ne dépasse pas T/ 4 afin de ne pas réduire trop le nombre de comparaisons.

Le calcul est effectué en faisant varier k 1 à K et détecter la corrélation r entre la colonne Yt et la colonne de la variable retardée Yt-k:

, où Il est la moyenne de la colonne .

Vous êtes ainsi obtenu une valeur de rk pour chaque valeur de k.

La construction et l'interprétation du graphique

icône Loupe mgx2.svg Le même sujet en détail: Analyse des séries chronologiques.

Les couples de valeurs (k, rk) Sont présentés dans un graphique cartésien, avec les retards sur les abscisses et les corrélations correspondantes le long de l'axe des ordonnées:

corrélogramme
Des exemples de (auto) corrélogramme

Ces graphiques peuvent présenter les tendances les plus disparates, mais sont normalement comparés à ceux illustrés sur la figure. Nous avons en fait les trois situations typiques suivantes:

  • la valeur de rk est toujours positif et diminue lentement la k (Graphique de gauche sur la figure); cela signifie que les valeurs de la série chronologique sont fortement corrélées à la série retardée d'une période, puis un peu moins pour le retard de deux périodes, et ainsi de suite, à savoir que cela est influencé par le passé récent, ce en dépensant plus à distance et, en général, que la série présente une tendance sous-jacente (par exemple, a tendance à croître de façon linéaire ou de façon exponentielle au fil du temps, dans le jargon de l'analyse des séries chronologiques, il est dit que prévaut composante tendancielle, ou tendances);
  • la valeur de rk Elle varie, mais est positive et maximale en correspondance des valeurs de k par exemple configurer une périodicité annuelle, par exemple, k égal à 4 ou leurs multiples dans le cas des données trimestrielles, alors qu'elle est plus faible ou négative pour les autres valeurs de k (Graphique au centre de la figure); cela signifie que les valeurs d'un instant donné ou de la période de l'année sont fortement corrélées à celles des mêmes instants ou périodes des années précédentes, de sorte que le phénomène varie au cours de chaque année et de manière similaire d'une année ( il est dit que l'emporte saison);
  • les valeurs de rk varient, mais pour k > 0 fluctuent toujours dans une bande étroite (graphique de droite sur la figure);[1] cela signifie que la série ne sont pas en corrélation significative avec la série retardée, à savoir que le passé ne « explique » le présent et que les variations d'un instant ou d'une période à l'autre sont essentiellement aléatoire (on dit que prévaut composant accidentel ou partie stochastique).

Le corrélogramme est donc utile de détecter immédiatement tout élément dominant avant de procéder à l'analyse proprement dite de la série, mais aussi de vérifier les résultats de cette. Par exemple, l'analyse peut conduire à l'élaboration d'un modèle du type:

et l'estimation de ses paramètres; indiquant Les estimations des paramètres, vous pouvez calculer les valeurs estimées du phénomène:

ainsi que les différences entre les valeurs observées et les valeurs estimées, ladite résidu:

Le corrélogramme de ces différences devrait montrer une tendance similaire à celle du graphique à droite sur la figure, qui est, les différences doivent apparaître au hasard; sinon, il faut supposer que le modèle n'est pas tout à fait adéquate à la description et l'interprétation du phénomène (par exemple, pourrait ne pas être en mesure de saisir une composante tendancielle ou saisonnière).

exemple

Imaginez que vous avez une portée de 100 observations trimestrielles. Peut-être les données relatives à la consommation des ménages pour les produits alimentaires, ou similaires, et de présenter un modèle tel que celui illustré dans le premier graphique sur la gauche de la figure suivante:[2]

corrélogramme
Exemple d'utilisation de corrélogrammes

Étant donné que la série présente une tendance à la hausse, vous pourriez penser à un modèle de croissance linéaire du type:

avec en tant que composant résiduel purement aléatoire. Cependant, le corrélogramme de la série (le deuxième graphique de gauche) doit indiquer que, à côté de la tendance de croissance linéaire, il est une composante saisonnière (r Il est pas toujours en baisse, mais augmente pour k multiple de 4). En fait, en calculant les résidus entre les valeurs observées et celles estimées et la production de son corrélogramme vous obtiendrez le troisième graphique de la gauche, ce qui indique clairement la présence d'une composante saisonnière.

Vous pouvez ensuite introduire le caractère saisonnier de changer le modèle comme suit:

D1t Il est 1 si t Il correspond à un premier trimestre et 0 sinon, D2t Il est 1 si t correspond à un deuxième trimestre et 0 sinon, et ainsi de suite (en substance, le modèle dit que le phénomène des augmentations moyennes de 42,2 chaque trimestre, mais diminue chaque année de 328, 392 et 362, respectivement, dans les première, deuxième et troisième trimestres, tandis que l'augmentation du quatrième trimestre 1082). En calculant la nouvelle corrélogramme des résidus aurait le quatrième graphique; cela indique que la différence entre les valeurs et ces estimations sont maintenant sensiblement aléatoire et observé que, par conséquent, le second modèle interprète de manière satisfaisante la tendance du phénomène.

notes

  1. ^ Les graphiques de la figure ont été produits avec la fonction acf () l'Ensemble des programmes statistiques R, qui comprend également la valeur de r pour k = 0; dans ce cas, la série est corrélée avec elle-même et a évidemment r = 1.
  2. ^ Les données ont été créées en R comme suit:
    t = 1: 100
    y = 21500 + 42,2 * t
    s = rep (c (-328, -392, -362,1082), 25)
    a = Rnorm (100) * 100
    Y = y + s + a

bibliographie

  • Tommaso Di Fonzo et Francesco Lisi, séries chronologiques économiques, Roma, Carocci, 2005. ISBN 9788843034239.
  • Gary Koop, La logique des données statistiques et économiques, Turin, UTET, 2001. ISBN 8877507357.

D'autres projets

  • Il contribue à Wikimedia Commons Wikimedia Commons: Il contient des images ou d'autres fichiers corrélogramme