Quantification des informations qualitatives pour les modèles économétriques

Estimation d'un modèle économétrique exige que toutes les informations être quantifiée. En d'autres termes, les chiffres doivent être utilisés pour caractériser vos deux variables quantitatives et qualitatives. Les variables quantitatives sont généralement codés avec des valeurs numériques dans les données brutes, mais les variables qualitatives sont susceptibles de vous obliger à effectuer une manipulation de quantification. Ici, vous découvrirez comment quantifier les variables lorsque l'on travaille avec deux groupes ou avec de multiples groupes.

Sommaire

Définition d'une variable muette lorsque vous avez seulement deux caractéristiques possibles

Dans de nombreux cas, les caractéristiques qualitatives que vous souhaitez inclure dans votre analyse économétrique ont deux groupes (ou catégories). En général, vous avez deux groupes lors observations de l'échantillon ont un "présent" option ou "que". Par exemple, dans la plupart des enquêtes, le sexe est considéré comme masculin ou féminin.

Si une caractéristique qualitative a deux groupes, vous devez en créer un variable muette afin de saisir quantitativement cet attribut. La variable binaire prend la valeur 1 si l'une des deux caractéristiques est présent et 0 si l'autre caractéristique est observée. Le groupe qui est identifié (ou affecté) 0 valeurs pour la variable fictive créée est appelée votre referrence ou groupe de base.

Le tableau illustre comment vous pouvez créer une variable fictive de vos données originales. Colonne 1 contient le titre du film, et la colonne 2 contient le nom de l'acteur principal. Colonne 3 ne fait pas partie des données d'origine, mais vous pouvez créer la variable Femelle en utilisant les informations dans la colonne 2.




La variable Femelle est une variable muette égale à 1 si l'acteur principal est une femme et égal à 0 si l'acteur principal est un homme. Notez que seule variable fictive est nécessaire pour capturer les deux possibilités (dans ce cas, mâles et femelles).

Représenter Acteur Sexe avec une variable fictive
1 Titre2 Plomb3 Femme
FireproofKirk Cameron0
TransamericaFelicity Huffman1
The WrestlerMickey Rourke0
AkeelahKeke Palmer1
Le Dernier roi d'EcosseJames McAvoy0

Source: IMDb

Vos résultats économétriques ne sont pas affectées par le groupe auquel vous décidez d'attribuer un 1 et le groupe auquel vous attribuez un 0 dans votre variable fictive.

Jongler avec plusieurs caractéristiques variables muettes

Dans certains cas, les caractéristiques qualitatives que vous souhaitez inclure dans votre analyse économétrique ont plus que deux groupes (ou catégories). En général, vous travaillez avec plusieurs groupes quand observations de l'échantillon sont classés dans l'une des nombreuses possibilités. Par exemple, une entreprise peut être situé dans la région de l'Ouest, le Midwest, du Sud ou du Nord-Est du pays.

Afin de saisir quantitativement un attribut qualitatif avec de nombreux groupes (ou possibilités), vous devez créer des variables muettes pour chaque groupe moins de 1. La variable fictive prend la valeur 1 si une caractéristique particulière est présente et 0 sinon.

En d'autres termes, si vous avez J groupes, vous avez besoin J - 1 variables nominales avec 1 et de 0 pour capturer toutes les informations qualitatives. Le groupe qui ne possède pas une variable factice est identifié lorsque toutes les autres valeurs factices sont 0, et il est appelé votre référence ou d'un groupe de base.

Avec ces données, vous pouvez créer les variables muettes dont vous avez besoin à partir d'une variable qualitative avec plusieurs groupes. Colonne 1 contient le titre du film, et la colonne 2 contient la MPAA (G, PG, PG13, ou R). Les colonnes 3, 4 et 5 ne font pas partie des données d'origine, mais vous pouvez les créer en utilisant les informations de classification MPAA dans la colonne 2.

Notez que le nombre de variables muettes dont vous avez besoin est un de moins (trois) que le nombre de résultats possibles pour la caractéristique qualitative (dans ce cas, quatre: G, PG, PG13, et R).

Représenter MPAA avec variables muettes
1 Titre2 MPAA3 PG4 PG13R 5
FireproofPG100
TransamericaR001
Le visiteurPG13010
AccidentR001
Herbie: Fully Loadedg000

Source: IMDb

Le groupe auquel vous choisissez d'attribuer un 0 sur toute la largeur ne pas affecter vos résultats économétriques. Ces observations (dans cet exemple, des films comme G-évaluant Herbie: Fully Loaded) Sont important d'inclure et ne affecter les résultats globaux, car ils font tous partie du groupe de référence. Il n'a pas d'importance, cependant, quel type de film est choisi pour être le groupe de référence.


» » » » Quantification des informations qualitatives pour les modèles économétriques