Application des méthodes statistiques aux problèmes économiques

Econometrics étudiants apprécient toujours un examen des concepts statistiques qui sont le plus important pour réussir avec l'économétrie. Plus précisément, vous devez être à l'aise avec des distributions de probabilités, le calcul de statistiques descriptives et tests d'hypothèses.

Sommaire

Votre capacité à quantifier avec précision les relations économiques ne dépend pas seulement sur vos économétriques compétences de création de modèle, mais aussi sur la qualité des données que vous utilisez pour l'analyse et votre capacité à adopter les stratégies appropriées pour les modèles d'estimation qui sont susceptibles de violer une hypothèse statistique . Les données doivent être issus d'un processus de collecte fiable, mais vous devriez aussi être conscient des limitations ou des défis supplémentaires.

Ils peuvent comprendre, mais ne sont pas limités

  • Agrégation des données: Les informations qui peuvent provenir à un ménage, une personne ou niveau de l'entreprise est mesurée à une ville, département, région, ou au niveau du pays dans vos données.

  • Statistiquement corrélées mais économiquement non pertinentes variables: Certains ensembles de données contiennent une abondance d'informations, mais un grand nombre de variables peuvent avoir rien à voir avec la question économique vous êtes l'espoir de répondre.

  • Les données qualitatives: Ensembles de données riches comprennent généralement des variables qualitatives (l'information géographique, la race, et ainsi de suite), mais cette information nécessite un traitement spécial avant de pouvoir l'utiliser dans un modèle économétrique.

  • Classique modèle de régression linéaire (CLRM) insuffisance de prise en charge: La légitimité de votre approche économétrique repose toujours sur un ensemble d'hypothèses statistiques, mais vous êtes susceptible de trouver au moins un de ces hypothèses ne tient pas (ce qui signifie qu'il ne vaut pas pour vos données).




Économètres se différencient des statisticiens en insistant sur les violations des hypothèses statistiques qui sont souvent pris pour acquis. La technique la plus courante pour estimer un modèle économétrique est moindres carrés ordinaires (MCO). Cependant, un certain nombre d'hypothèses de CLRM doit détenir pour que la technique OLS pour fournir des estimations fiables. Dans la pratique, les hypothèses qui sont les plus susceptibles d'échouer dépendent de vos données et de l'application spécifique.

Reconnaissant l'importance du type de données, la fréquence et l'agrégation

Les données que vous utilisez pour estimer et tester votre modèle économétrique est généralement classé dans l'un des trois types possibles:

  • Section transversale: Ce type de données se compose de mesures pour les observations individuelles (des personnes, des ménages, des entreprises, des comtés, états, pays, ou autre) à un point donné dans le temps.

  • Des séries chronologiques: Ce type de données se compose de mesures sur une ou plusieurs variables (tels que le produit intérieur brut, les taux d'intérêt ou des taux de chômage) au fil du temps dans un espace donné (comme un pays ou d'un état spécifique).

  • Panneau ou longitudinale: Ce type de données se compose d'une série chronologique pour chaque unité de section transversale dans l'échantillon. Les données contiennent des mesures pour les observations individuelles (des personnes, des ménages, des entreprises, des comtés, états, pays, etc.) sur une période de temps (jours, mois, trimestres ou années).

Le type de données que vous utilisez peut influencer la façon dont vous estimez votre modèle économétrique. En particulier, des techniques spécialisées sont généralement nécessaires pour faire face à des données chronologiques et de panneaux.

Vous pouvez anticiper les problèmes économétriques courants parce que certaines défaillances dans les hypothèses du CLRM sont plus susceptibles à des types particuliers de données. Deux cas typiques de défaillances d'hypothèses impliquent CLRM hétéroscédasticité (qui se produit fréquemment dans les modèles utilisant des données en coupe transversale) et auto-corrélation (qui tend à être présente dans les modèles utilisant des données de séries chronologiques).

En plus de connaître le type de données que vous travaillez avec, assurez-vous que vous êtes toujours au courant des informations suivantes:

  • Le niveau de agrégation utilisé pour mesurer les variables: Le niveau d'agrégation se réfère à l'unité d'analyse lorsque l'information est acquise pour les données. En d'autres termes, les mesures variables peuvent provenir à un niveau inférieur d'agrégation (comme un individu, du ménage, ou de l'entreprise) ou à un niveau plus élevé d'agrégation (comme une ville, comté ou État).

  • La fréquence avec lequel les données sont saisies: La fréquence se réfère à la vitesse à laquelle les mesures sont obtenues. Les séries chronologiques peuvent être capturées à une fréquence plus élevée (comme horaire, quotidienne, ou hebdomadaire) ou à la fréquence inférieure (comme mensuelle, trimestrielle ou annuelle).

Toutes les données dans le monde ne va pas vous permettent de produire des résultats probants si le niveau d'agrégation ou la fréquence ne convient pas à votre problème. Par exemple, si vous êtes intéressés à déterminer comment les dépenses par élève affecte le rendement scolaire, les données au niveau de l'État ne sera probablement pas approprié parce que les dépenses et les caractéristiques des élèves ont tellement de variation dans les villes au sein des Etats que vos résultats sont susceptibles d'être trompeuses.

Éviter le piège de data-mining

Comme vous acquérir plus d'outils d'analyse de données, vous pouvez être enclins à rechercher les données pour les relations entre les variables. Vous pouvez utiliser votre connaissance des statistiques de trouver des modèles qui correspondent à vos données tout à fait bien. Cependant, cette pratique est connue comme l'extraction de données, et vous ne voulez pas être séduit par elle!

Bien que l'extraction de données peut être utile dans des domaines où le mécanisme sous-jacent à générer les résultats est pas important, la plupart des économistes ne considèrent pas cette approche favorable. En économétrie, de construire un modèle qui fait sens et est reproductible par d'autres est beaucoup plus important que de chercher un modèle qui a un ajustement parfait.

Intégrer informations quantitatives et qualitatives

Les résultats économiques peuvent être affectés par des facteurs quantitatifs (numériques) et qualitatives (non numériques). Généralement, l'information quantitative a une application directe et l'interprétation dans les modèles économétriques.

Les variables qualitatives sont associés à des caractéristiques qui ont pas de représentation numérique naturelle, bien que vos données brutes peuvent coder caractéristiques qualitatives avec une valeur numérique. Par exemple, une région des États-Unis peut être codé avec un 1 pour l'Ouest, 2 pour le Sud, 3 pour Midwest, et 4 pour Northeast. Toutefois, l'attribution des valeurs spécifiques est arbitraire et ne comporte pas de signification particulière.

Afin d'utiliser les informations contenues dans les variables qualitatives, vous aurez généralement les convertir en variables fictives - variables dichotomiques qui prennent une valeur de 1 si une caractéristique particulière est présente et 0 sinon.

Parfois, le résultat économique elle-même est qualitative ou contient des valeurs restreintes. Par exemple, votre variable dépendante pouvait mesurer si oui ou non une entreprise échoue (faillite) dans une année donnée en utilisant diverses caractéristiques de l'entreprise comme variables indépendantes. Bien que les techniques conventionnelles sont parfois acceptable avec variables dépendantes qualitatives et non continues, en général, ils se traduisent par des violations des hypothèses et nécessitent une approche économétrique alternative.


» » » » Application des méthodes statistiques aux problèmes économiques