Comment trouver les différences moyennes en utilisant une variable fictive

Vous devez rappeler à partir de votre cours de statistiques façon de mener la t

Sommaire

-test pour examiner les différences de moyens entre les deux groupes. Mais ce que vous ne pouvez pas savoir est que vous pouvez utiliser des variables nominales et analyse de régression pour obtenir les mêmes résultats que la t-test.

Spécification

Même si votre modèle économétrique est susceptible d'inclure des caractéristiques quantitatives et qualitatives, vous pouvez commencer avec un modèle qui utilise uniquement une variable fictive pour capturer les caractéristiques qualitatives et ignore les autres variables indépendantes potentielles. Ce processus revient à identifier les différences dans les moyens pour les groupes identifiés par la variable (s) fictif, mais il est un bloc de construction utile à la compréhension des modèles plus réalistes qui combinent les caractéristiques qualitatives avec des variables quantitatives.

Si la caractéristique qualitative que vous souhaitez utiliser comme une variable indépendante ne contient que deux groupes, puis un modèle économétrique avec une seule variable muette comme la seule variable explicative peut être exprimé en

image0.jpg

Y est la variable dépendante,

image1.jpg


est le point d'intersection (ou constante) terme, et

image2.jpg

est l'impact de la caractéristique représentée par la variable factice (). je = 1 si la caractéristique qualitative spécifique est présent et je = 0 sinon.

Si la caractéristique qualitative que vous souhaitez utiliser comme une variable indépendante a plus que deux groupes, alors le modèle économétrique doit inclure J - 1 variables à saisir pleinement les possibilités. Supposons que vous souhaitez utiliser une variable avec une caractéristique qualitative contenant quatre résultats possibles {A, B, C, et D}. Le modèle économétrique de base pour capturer une caractéristique qualitative est exprimée en

image3.jpg

iB = 1 si l'observation appartient au groupe B, iC = 1 si l'observation appartient au groupe C, iD = 1 si l'observation appartient au groupe D, et iB = iC = iD = 0 si l'observation est dans le groupe A. En utilisant cette équation, vous affectez implicitement groupe A comme référence ou d'un groupe de base dans toute comparaison de deux groupes.

Lecture

Une façon utile de voir le rôle d'une variable factice dans un modèle économétrique est d'interpréter les résultats d'une régression en utilisant une variable muette comme la seule variable indépendante.

Une régression estimée avec une variable fictive est généralement écrit comme

image4.jpg

où le

image5.jpg

termes représentent les paramètres estimés. Car ne peut être 0 ou 1 pour une observation donnée,

image6.jpg

La prédite Y une valeur de régression représente l'estimation de la moyenne conditionnelle (E(Y | je)). Une variable nominale a seulement deux valeurs, de sorte que vous obtenez deux prédit Y des valeurs. Par conséquent, la prédite Y les valeurs sont égales à la moyenne de l'échantillon pour chaque groupe.


» » » » Comment trouver les différences moyennes en utilisant une variable fictive