Comment trouver les différences moyennes en utilisant une variable fictive
Vous devez rappeler à partir de votre cours de statistiques façon de mener la t
Sommaire
Spécification
Même si votre modèle économétrique est susceptible d'inclure des caractéristiques quantitatives et qualitatives, vous pouvez commencer avec un modèle qui utilise uniquement une variable fictive pour capturer les caractéristiques qualitatives et ignore les autres variables indépendantes potentielles. Ce processus revient à identifier les différences dans les moyens pour les groupes identifiés par la variable (s) fictif, mais il est un bloc de construction utile à la compréhension des modèles plus réalistes qui combinent les caractéristiques qualitatives avec des variables quantitatives.
Si la caractéristique qualitative que vous souhaitez utiliser comme une variable indépendante ne contient que deux groupes, puis un modèle économétrique avec une seule variable muette comme la seule variable explicative peut être exprimé en
où Y est la variable dépendante,
est le point d'intersection (ou constante) terme, et
est l'impact de la caractéristique représentée par la variable factice (ré). réje = 1 si la caractéristique qualitative spécifique est présent et réje = 0 sinon.
Si la caractéristique qualitative que vous souhaitez utiliser comme une variable indépendante a plus que deux groupes, alors le modèle économétrique doit inclure J - 1 variables à saisir pleinement les possibilités. Supposons que vous souhaitez utiliser une variable avec une caractéristique qualitative contenant quatre résultats possibles {A, B, C, et D}. Le modèle économétrique de base pour capturer une caractéristique qualitative est exprimée en
où réiB = 1 si l'observation appartient au groupe B, réiC = 1 si l'observation appartient au groupe C, réiD = 1 si l'observation appartient au groupe D, et réiB = réiC = réiD = 0 si l'observation est dans le groupe A. En utilisant cette équation, vous affectez implicitement groupe A comme référence ou d'un groupe de base dans toute comparaison de deux groupes.
Lecture
Une façon utile de voir le rôle d'une variable factice dans un modèle économétrique est d'interpréter les résultats d'une régression en utilisant une variable muette comme la seule variable indépendante.
Une régression estimée avec une variable fictive est généralement écrit comme
où le
termes représentent les paramètres estimés. Car ré ne peut être 0 ou 1 pour une observation donnée,
La prédite Y une valeur de régression représente l'estimation de la moyenne conditionnelle (E(Y | réje)). Une variable nominale a seulement deux valeurs, de sorte que vous obtenez deux prédit Y des valeurs. Par conséquent, la prédite Y les valeurs sont égales à la moyenne de l'échantillon pour chaque groupe.