Comment calculer la régression linéaire multiple pour six sigma

Qu'est-ce que les praticiens Six Sigma doivent faire avec toutes les situations où plus d'un X une influence Y? Tu utilises la régression linéaire multiple. Après tout, ce genre de situation est plus commun que d'une seule variable d'influence est. Lorsque vous travaillez pour créer une équation qui comprend plus d'une variable - comme Y = F(X1, X2, . . ., Xn).

La forme générale du modèle de régression linéaire multiple est simplement une extension du modèle de régression linéaire simple Par exemple, si vous avez un système où X1 et X2 à la fois contribuer à Y, le modèle de régression linéaire multiple devient

Yje = # 946-0 + # 946-1X1 + # 946-11X12 + # 946-2X2 + # 946-22X22 + # 946-12X1X2 + # 949-

Cette équation comporte cinq types distincts de termes:

  • # 946-0: Ce terme est le effet global. Il définit le niveau de départ de tous les autres effets, quel que soit le X variables sont définies au.

  • # 946-jeXje: La # 946-1X1 et # 946-2X2 les pièces sont la effets principaux termes de l'équation. Tout comme dans le modèle de régression linéaire simple, ces termes capturer l'effet linéaire chaque Xje a sur la sortie Y. L'amplitude et la direction de chacun de ces effets sont pris dans l'Associated # 946-je coefficients.

  • # 946-je jeXje2: # 946-11X12 et # 946-22X22 sont les deuxième ordre ou effets carrés pour chacun de la Xs. Parce que la variable est portée à la seconde puissance, l'effet est plutôt que linéaire quadratique. L'ampleur et la direction de chacun de ces effets de second ordre sont indiqués par l'Associated # 946-je je coefficients.

  • # 946-12X1X2: Cet effet est appelé le effet d'interaction. Ce terme permet aux variables d'entrée à avoir un effet interactif ou sur les résultats combinés Y. Encore une fois, la grandeur et la direction de l'effet d'interaction sont capturés dans la # 946-12 coefficient.




  • # 949-: Ce comptes à terme pour toute la variation aléatoire que les autres conditions ne peuvent pas expliquer. # 949- est une distribution normale avec son centre à zéro.

L'équation de régression linéaire multiple peut s'adapter beaucoup plus qu'un simple ligne- il peut accueillir des courbes, des surfaces en trois dimensions, et des relations encore plus abstraits n-espace tridimensionnel! La régression linéaire multiple peut gérer tout ce que vous lui lancez. Le processus pour effectuer une régression linéaire multiple suit le même schéma que la régression linéaire simple fait:

  1. Rassembler les données pour le Xet la s Y.

  2. Estimer les multiples coefficients de régression linéaire.

    Lorsque vous avez plus d'un X variables, les équations pour dériver le # 946-S deviennent très complexes et très fastidieux. Vous voulez certainement d'utiliser un outil logiciel d'analyse statistique pour calculer automatiquement ces équations pour vous. La # 946-s juste pop dès la sortie. Sinon, aller acheter une boîte de crayons et numéro 2 retrousser vos manches!

  3. Vérifiez les valeurs résiduelles pour confirmer qu'ils respectent les hypothèses initiales du modèle de régression linéaire multiple.

    Vérifier que les résidus sont normale est d'une importance cruciale. Si la variation des résidus est pas centrée sur zéro et la variation est pas aléatoire et normale, les hypothèses de départ du modèle de régression linéaire multiple ne sont pas remplies, et le modèle est invalide.

  4. Effectuer des tests statistiques pour voir qui concerne les linéaires multiples termes de l'équation de régression sont significatifs (et doivent être conservés dans le modèle) et qui sont insignifiantes (et doivent être supprimés).

    Certains termes de l'équation de régression multiple ne sont pas significatifs. Vous découvrir ceux qui en effectuant une F test pour chaque terme de l'équation. Lorsque la contribution de la variation d'un terme de l'équation est faible par rapport à la variation résiduelle, ce terme ne passera pas la F tester, et vous pouvez retirer de l'équation.

    Votre but est de simplifier l'équation de régression, autant que possible, tout en maximisant la R2 métrique de l'ajustement. Généralement, plus simple est toujours mieux. Donc, si vous trouvez deux équations de régression que les deux ont la même R2 valeur, vous voulez installer sur celui avec le moins, les termes les plus simples.

    Habituellement, les termes d'ordre supérieur sont les premiers à partir. Il ya juste moins de chance d'un terme au carré ou un terme d'interaction étant statistiquement significative.

  5. Calculer le coefficient de détermination finale R2 pour le modèle de régression linéaire multiple.

    Utilisez le R2 métrique de quantifier combien de la variation observée votre équation finale explique.

Avec un bon logiciel d'analyse de plus en plus accessible, la puissance de régression linéaire multiple est disponible à un public de plus en plus. De nombreux outils logiciels d'analyse statistique plus sophistiqués algorithmes ont même automatisés qui recherchent à travers les diverses combinaisons des termes de l'équation tout en maximisant R2.


» » » » Comment calculer la régression linéaire multiple pour six sigma