Construction du modèle avec régression pas à pas

category Education et langues / La science / Biologie

Une des raisons (mais pas la seule raison) pour l'exécution d'une analyse de régression multiple est à venir avec une formule de prédiction pour une variable de résultat, basé sur un ensemble de variables prédictives disponibles. Idéalement, vous aimeriez cette formule d'être parcimonieux - d'avoir aussi peu de variables que possible, mais encore faire de bonnes prédictions.

Alors, comment choisissez-vous, parmi un grand tas de variables prédictives, le plus petit sous-ensemble nécessaire pour faire un bon modèle de prédiction? Ceci est appelé le “ bâtiment modèle ” problème, qui est un sujet de recherche active par les statisticiens théoriques. Aucune méthode a émergé comme la meilleure façon de sélectionner les variables à inclure. Malheureusement, les chercheurs utilisent souvent des méthodes informelles qui semblent raisonnables, mais ne sont pas vraiment très bon, comme ce qui suit:

Faites une grande régression multiple en utilisant toutes les variables disponibles, puis déposez ceux qui ne sortent significative. Cette approche peut manquer certains prédicteurs importants en raison de la colinéarité.
Exécutez régressions univariées sur chaque prédicteur possible individuellement, puis sélectionnez uniquement les prédicteurs qui étaient significatifs (ou presque) significative sur les tests univariés. Mais parfois une variable prédictive vraiment important est pas significativement associée à l'issue lorsqu'il est testé par lui-même, mais seulement lorsque les effets de certaines autres variables ont été compensés. Ce problème est l'inverse du problème de la signification de disparaître - il est pas aussi commun, mais cela peut arriver.

Il est une autre façon - de nombreuses statistiques offrent des forfaits régression pas à pas, dans lequel vous fournissez toutes les variables prédictives disponibles, et le programme passe ensuite à travers un processus similaire à ce qu'un être humain (avec un esprit logique et beaucoup de temps sur les mains) pourraient faire pour identifier le meilleur sous-ensemble de ces prédicteurs. Le programme tente de façon très systématique ajoutant et supprimant les divers prédicteurs du modèle, un à la fois, pour voir ce qui prédicteurs, lorsqu'il est ajouté à un modèle, d'améliorer sensiblement sa capacité prédictive, ou lorsqu'il est retiré du modèle, faire bien pire.

Régression par étapes peut utiliser plusieurs algorithmes différents, et les modèles peut être jugée meilleure ou pire par plusieurs critères différents. En général, ces méthodes font souvent un travail décent de ce qui suit:

La détection et l'abandon des variables qui ne sont pas associés avec le résultat, soit en régression univariée ou multiple
La détection et l'abandon variables redondantes (prédicteurs qui sont fortement associées à de meilleurs prédicteurs de l'issue)
Détecter et y compris les variables qui peuvent ne pas avoir été significatif dans la régression univariée, mais qui sont importants lorsque vous réglez les effets des autres variables

La plupart des logiciels de régression par degrés vous permet également de “ la force ” certaines variables dans le modèle, si vous savez (à partir de preuves physiologiques) que ces variables sont des prédicteurs importants de l'issue.

A propos Auteur

Calculer un modèle de régression sur la TI-83 Plus

La modélisation de régression est le processus de trouver une fonction qui correspond approximativement à la relation entre les deux variables en deux listes de données. Pour calculer un modèle de régression pour vos données à deux variables…

La modélisation de régression sur la TI-84 Plus

La modélisation de régression est le processus de trouver une fonction qui correspond approximativement à la relation entre les deux variables en deux listes de données. Le tableau montre les types de modèles de régression de la calculatrice…

Résultats d'une régression sur la TI-Nspire

Une variété de variables (26 en tout) sont stockées par TI-Nspire après une régression. Pour afficher cette liste, ajouter une page Calculatrice et appuyez sur [VAR]. En utilisant letouches, vous pouvez faire défiler cette liste et coller une…

L'estimation économétrique et les hypothèses de CLRM

Techniques économétriques sont utilisés pour estimer les modèles économiques, qui permettent en fin de compte que vous nous expliquiez comment divers facteurs affectent certaines résultat d'intérêt ou à la prévision d'événements futurs.…

Econometrics: le choix de la forme fonctionnelle de votre modèle de régression

En économétrie, la procédure d'estimation standard pour le modèle de régression linéaire classique, moindres carrés ordinaires (MCO), peut accueillir relations complexes. Par conséquent, vous avez une quantité considérable de souplesse…

Comment estimer les effets de saisonnalité

Effets de saisonnalité peuvent être corrélées avec vos deux variables dépendantes et indépendantes. Afin d'éviter de confondre les effets de saisonnalité avec ceux de vos variables indépendantes, vous devez contrôler explicitement pour la…

Comment sélectionner des variables indépendantes pour votre modèle économétrique

L'une des décisions les plus importantes que vous faites lorsque vous spécifiez votre modèle économétrique est variables à inclure comme variables indépendantes. Ici, vous trouverez ce que des problèmes peuvent survenir si vous incluez trop…

Multicolinéarité parfaite et votre modèle économétrique

Obtenir une emprise sur multicolinéarité parfaite, ce qui est rare, est plus facile si vous pouvez imaginer un modèle économétrique qui utilise deux variables indépendantes, telles que les suivantes:Supposons que, dans ce modèle,où les…

Précisant votre modèle de régression de l'économétrie

En économétrie, le modèle de régression est un point de départ commun d'une analyse. Comme vous définir votre modèle de régression, vous devez tenir compte de plusieurs éléments:La théorie économique, l'intuition et le bon sens devraient…

Les 2 types de multicolinéarité

Multicollinearity lorsque survient une relation linéaire existe entre deux ou plusieurs variables indépendantes dans un modèle de régression. Dans la pratique, vous rencontrez rarement multicolinéarité parfaite, mais de haute…

Comment les entreprises utilisent des statistiques d'analyse de régression

L'analyse de régression est un outil statistique utilisé pour l'étude des relations entre les variables. Habituellement, l'enquêteur cherche à savoir l'effet causal d'une variable sur une autre - l'effet d'une hausse des prix sur demande, par…

Déterminer le rôle de variables dans les statistiques de la psychologie

Dans les statistiques de la psychologie, les études de recherche qui impliquent la collecte des données quantitatives (toutes les données qui peut être compté ou rendu sous forme de nombres) exigent habituellement que vous récupériez et…

Comment traiter avec des données manquantes d'un essai clinique

La plupart des essais cliniques ont des données incomplètes pour une ou plusieurs variables, qui peut être un véritable casse-tête lors de l'analyse de vos données. Les aspects statistiques de données manquantes sont assez compliquées, donc…

Comment calculer la régression linéaire multiple pour six sigma

Qu'est-ce que les praticiens Six Sigma doivent faire avec toutes les situations où plus d'un X une influence Y? Tu utilises la régression linéaire multiple. Après tout, ce genre de situation est plus commun que d'une seule variable d'influence…

godiches.com » Education et langues » La science » Biologie » Construction du modèle avec régression pas à pas