s
19 708 Pages

la modèles linéaires généralisés (GLM) sont une généralisation du modèle linéaire classique dans le contexte de régression linéaire. Alors que dans le modèle linéaire classique, on suppose que la variable endogène est répartie de telle manière normal, dans le contexte de la variable endogène des modèles linéaires généralisés peut être distribué comme une variable aléatoire d'une famille exponentielle et, par conséquent, en plus de V.C. même la variable aléatoire normale binomial, Poisson, gamme, inverse normale et d'autres.

modèles linéaires généralisés ont été formulés par John Nelder et Robert Wedderburn comme un moyen d'égaliser à l'intérieur d'un modèle unique plusieurs autres modèles statistiques, y compris la modèle linéaire, la régression logistique et la régression de Poisson. Il parvient ainsi à intégrer d'autres modèles.

introduction

Dans un GLM, chaque valeur de la variable dépendante Y Il est supposé être généré à partir d'une variable aléatoire particulier de la famille exponentielle, qui comprend plusieurs variables aléatoires telles que binomial, Poisson, gamme, inverse normale et d'autres. la moyenne μ de la distribution, il dépend de la variable indépendante X:

où E (Y) Il est valeur attendue de Y; Xβ Il est le facteur prédictif linéaire, une combinaison linéaire de paramètres inconnus β; g Il est la fonction que l'on appelle lien.

Dans ce contexte, la variance est généralement fonction V moyenne:

Il est pratique si V Il est distribué en tant que V.C. la famille exponentielle, mais il peut être simplement que la variance est fonction de la valeur estimée.

Les paramètres inconnus β Ils sont généralement estimés par la méthode veromiglianza maximale, presque les techniques du maximum de vraisemblance ou bayésienne.

Les composantes du modèle

Le GLM est composé de trois éléments:

  1. La fonction de distribution fa, partie de la famille exponentielle
  2. Le prédicteur linéaire η = Xβ .
  3. Une fonction g, appelés « liens », tel que E (Y) = μ = g-1(η).

liens externes