Spécification des fonctions non linéaires appropriées: les modèles probit et logit
Si votre résultat d'intérêt est qualitative, vous utilisez une variable dépendante mannequin et estimer la probabilité que le résultat (Y
Sommaire
Le problème le plus évident avec l'estimation d'un modèle variable dépendante fictive utilisant OLS est que les probabilités prédites ne sont pas garantis pour être dans le intervalle [0,1]. MCO ne peut pas être modifié pour répondre entièrement à cette question parce que la non-linéarité des paramètres est nécessaire afin de garantir que toutes les probabilités prédites ont des valeurs sensibles. Par conséquent, une autre spécification doit être utilisé. Économètres choisissent soit l'probit ou la fonction logit.
Avec une fonction de probit ou logit, les probabilités conditionnelles sont liées de façon non linéaire à la variable (s) indépendante. En outre, les deux fonctions ont la particularité d'aborder 0 et 1 progressivement (asymptotiquement), de sorte que les probabilités prédites sont toujours judicieux.
La figure illustre les probabilités conditionnelles d'un OLS (aussi connu comme le modèle de probabilité linéaire LPM), un probit, et un modèle logit.
Travailler à partir de la CDF normale standard: Le modèle probit
Le modèle probit est basé sur la norme fonction normale de densité cumulative (CDF), qui est définie comme
où Z est une variable normale standardisée et e est la base du logarithme naturel (la valeur 2,71828...).
Dans un modèle de probit, la norme CDF normale remplace la fonction linéaire, de sorte que vous estimez
Les termes de bêta ne peuvent être estimés par les MCO, si vous avez besoin d'utiliser une technique connue sous le nom plausibilité maximum (ML).
Pour toute donnée X, le modèle probit fournit la Z valeur pour l'observation. Le PDF normale standard ou CDF peuvent ensuite être utilisés pour obtenir la probabilité que Y = 1 pour cette observation.
La figure suivante montre comment s'y prendre pour trouver la probabilité pour une observation donnée.
Après avoir estimé un modèle probit, la plupart des logiciels économétriques peut calculer les probabilités prévues pour toutes les observations de l'échantillon.
Fondant au large de la CDF logistique: Le modèle logit
Le modèle logit est basée sur la fonction de densité cumulative logistique (CDF), définie comme
où g est une variable aléatoire logistique et e est la base du logarithme naturel (la valeur 2,71828...).
La distribution logistique peut vous être inconnus, mais il est semblable à une normale standard. Cependant, il n'a moins de densité dans un écart type de la moyenne d'une distribution normale. La figure suivante illustre la différence entre le normal standard et les distributions logistiques.
Dans un modèle logistique, la CDF logistique remplace la fonction linéaire de sorte que vous estimez
Note: Vous ne pouvez pas utiliser MCO pour estimer la betas- la place, vous devez utiliser la technique du maximum de vraisemblance (ML).
Pour toute donnée X, le modèle logit fournit la valeur pour l'observation qui peut être utilisé avec la CDF logistique pour trouver la probabilité que Y = 1 pour cette observation.
La figure suivante illustre comment vous trouvez la probabilité pour une observation donnée.
Lorsque vous avez votre modèle de logit estimatif, vous pouvez utiliser des logiciels tels que économétrique STATA pour calculer les probabilités prédites pour toutes vos observations de l'échantillon.