3 modèles de probabilité linéaire (LPM) Principaux problèmes

En utilisant la technique des moindres carrés ordinaires (MCO) pour estimer un modèle avec une variable dépendante factice est connu comme la création d'un modèle de probabilité linéaire,

Sommaire

ou LPM. LPM ne sont pas parfaits. Trois problèmes spécifiques peuvent se présenter:

  • La non-normalité du terme d'erreur

  • Erreurs hétéroscédastiques

  • Prédictions potentiellement absurdes

La non-normalité du terme d'erreur




L'hypothèse que l'erreur est normalement distribué est essentiel pour effectuer des tests d'hypothèses après l'estimation de votre modèle économétrique.

Le terme d'erreur d'un LPM a une distribution binomiale au lieu d'une distribution normale. Il implique que la traditionnelle t-les tests de signification individuelle et F-les tests de signification globale ne sont pas valides.

Comme vous pouvez le voir, le terme d'erreur dans un LPM a l'une des deux valeurs possibles pour une donnée X valeur. Une valeur possible pour l'erreur (si Y = 1) est donné par A, et l'autre valeur possible de l'erreur (si Y = 0) est donnée par B. Par conséquent, il est impossible pour le terme d'erreur d'avoir une distribution normale.

image0.jpg

Heteroskedasticity

Le modèle de régression linéaire classique (CLRM) suppose que le terme d'erreur est homoscédastique. L'hypothèse d'homoscédasticité est tenu de prouver que les estimateurs MCO sont efficaces (ou mieux). La preuve que estimateurs MCO sont efficaces est une composante importante du théorème de Gauss-Markov. La présence d'hétéroscédasticité peut provoquer le théorème de Gauss-Markov pour être violée et conduire à d'autres caractéristiques indésirables pour les estimateurs MCO.

Le terme d'erreur dans un LPM est hétéroscédastique parce que la variance est pas constante. Au lieu de cela, la variance du terme d'erreur LPM dépend de la valeur de la variable (s) indépendante.

Utilisation de la structure de la LPM, vous permet de caractériser la variance de son terme d'erreur comme suit

image1.jpg

Étant donné que la variance de l'erreur dépend de la valeur de X, il présente hétéroscédasticité plutôt que homoscédasticité.

Probabilités prédites Unbounded

La plupart des lois de base de probabilité indique que la probabilité d'un événement doit être contenue dans l'intervalle [0,1]. Mais la nature d'un LPM est telle qu'elle ne permet pas d'assurer cette loi fondamentale de la probabilité est satisfaite. Bien que la plupart des probabilités prédites à partir d'un LPM ont des valeurs raisonnables (entre 0 et 1), certaines probabilités prédites peuvent avoir des valeurs absurdes qui sont inférieur à 0 ou supérieur à 1.

Jetez un oeil à la figure suivante et de concentrer votre attention sur les segments de la ligne de régression où la probabilité conditionnelle est supérieure à 1 ou inférieure à 0. Lorsque la variable dépendante est continue, vous ne devez pas vous inquiéter au sujet des valeurs sans bornes pour le moyennes conditionnelles. Cependant, les variables dichotomiques sont problématiques parce que les moyens sursis représentent probabilités conditionnelles. Interprétation probabilités qui ne sont pas limitées par des 0 et 1 est difficile.

image2.jpg

Vous pouvez voir un exemple de ce problème avec les données réelles:

image3.jpg

La plupart des probabilités estimées à partir de l'estimation LPM sont contenus dans l'intervalle [0,1], mais la probabilité prédite pour la septième observation est négative. Malheureusement, rien dans l'estimation d'un LPM assure que toutes les probabilités prévues restent dans des valeurs raisonnables.


» » » » 3 modèles de probabilité linéaire (LPM) Principaux problèmes