L'estimation de la fonction de régression et les résidus
La fonction de régression est généralement exprimée mathématiquement dans l'une des façons suivantes: la notation de base, la notation de sommation, ou la notation matricielle. La Y variable représente le résultat que vous êtes intéressé à, appelé la variable dépendante, et la Xs représentent toutes les variables indépendantes (ou explicatives). Votre objectif est maintenant d'estimer la fonction de régression de la population (PRF) en utilisant les données des échantillons.
Lorsque l'on travaille sur les problèmes économétriques monde réel, vous spécifiez généralement un PRF avec une variable dépendante et plusieurs variables indépendantes. Par exemple, supposons que vous êtes intéressé par le nombre de hamburgers achetés pendant l'heure du déjeuner à cafétérias scolaires.
La théorie microéconomique suggère que les ventes devraient être influencés par le prix des hamburgers avec d'autres facteurs, comme le prix des autres produits alimentaires, le prix des boissons gazeuses, et ainsi de suite. Avec cela à l'esprit, vous pouvez spécifier votre PRF en utilisant les ventes de hamburgers comme variable dépendante et tous les autres facteurs pertinents tels que les variables indépendantes.
Pour visualiser la régression MCO et d'obtenir une compréhension de base du concept fondamental, supposons maintenant que la variable dépendante (de vente de hamburger) est influencé par une seule variable explicative (le prix des hamburgers).
L'exemple de fonction de régression (SRF) est exprimée en
où Y est la vente de hamburgers et X est le prix. Dans ce cas, la SRF est une ligne, avec la valeur de
l'estimation de l'ordonnée à l'origine et
l'estimation de la valeur de la pente.
Remarquez comment la représentation mathématique de la SRF utilise chapeaux (^) ci-dessus, les coefficients et les erreurs terme. Ce symbole est utilisé pour désigner que ces chiffres sont des estimations de leurs vraies valeurs de la population, mais gardez à l'esprit que certains manuels scolaires utilisent l'anglais (latins) des lettres pour représenter les coefficients de régression de l'échantillon et d'autres estimations.