Comment expliquer les résultats analytiques prédictifs de régression r

Une fois que vous créez un modèle de régression de R pour l'analyse prédictive, vous voulez être en mesure d'expliquer les résultats de l'analyse. Pour voir quelques informations utiles sur le modèle, le type dans le code suivant:

> Résumé (modèle)

La sortie fournit des informations que vous pouvez explorer si vous souhaitez modifier votre modèle plus loin. Pour l'instant, nous allons laisser le modèle tel qu'il est. Voici les deux dernières lignes de la sortie:

Multiple R-carré: 0,8741, R-carré ajusté: 0.8633F statistique: 80.82 sur 22 et 256 DF, p-valeur: lt; 2.2e-16

Un couple de points de données se démarquer ici:

La R au carré multiple valeur vous indique comment bien la ligne de régression correspond aux données (qualité de l'ajustement). Une valeur de 1 signifie qu'il est un ajustement parfait. Ainsi, un r-squared valeur de 0,874 est de bon il est dit que 87,4 pour cent de la variabilité mpg est expliquée par le modèle.
La p-valeur vous indique combien significative les variables prédictives affectent la variable de réponse. UN p-valeur de moins de (généralement) 0,05 signifie que vous pouvez rejeter l'hypothèse nulle que les variables prédictives ont collectivement aucun effet sur la variable de réponse (mpg). La p-valeur de 2.2e-16 (à savoir, 2,2 à 16 zéros en avant de celui-ci) est beaucoup plus petit que 0,05, de sorte que les prédicteurs ont un effet sur la réponse.

Avec le modèle créé, vous pouvez faire des prédictions contre elle avec les données de test vous avez partitionné de l'ensemble des données. Pour utiliser ce modèle pour prédire le pour chaque ligne de l'ensemble de test, vous exécutez la commande suivante:

> Prédictions lt; - prédire (modèle, testSet,
 intervalle = "prédire", level = 0,95)

Ceci est le code et la sortie des six premières prédictions:

> Tête (prévisions) lwr ajustement upr2 16,48993 10,530223 22,449644 18,16543 12,204615 24,126255 18,39992 12,402524 24,397326 12,09295 6,023341 18,162577 11,37966 5,186428 17,572898 11,66368 5,527497 17,79985

La sortie est une matrice qui présente les valeurs prédites de la s'adapter colonne et l'intervalle de prédiction dans le lwr et EPU colonnes - avec un niveau de 95 pour cent de confiance. Plus le niveau de confiance, plus la gamme, et vice versa.

La valeur prédite est dans le milieu de la range- afin de changer le niveau de confiance ne change pas la valeur prédite. La première colonne est le numéro de ligne de l'ensemble de données complet.

Pour voir du côté des valeurs réelles et prévues à côte de sorte que vous pouvez facilement les comparer, vous pouvez taper dans les lignes de code suivantes:

> La comparaison lt; - cbind (testSet $ mpg, prédictions [1])> colnames (comparaison) lt; - c ("réelle", "prédit")

La première ligne crée une matrice à deux colonnes avec les valeurs réelles et prévues. La deuxième ligne modifie les noms des colonnes réelles et prédites. Tapez la première ligne de code pour obtenir la sortie des six premières lignes de comparaison, comme suit:

> Tête (comparaison) de predicted2 réelle 15 16,489934 16 18,165435 17 18,399926 15 12,092957 14 11,379668 14 11,66368

Nous voulons aussi voir un résumé des deux colonnes de comparer leurs moyens. Ceci est le code et la sortie du résumé:

> Résumé (comparaison) actualpredictedMin. : 10,00 min. : 8.8491st Qu:. 16.00 1er Qu:. 17.070Median: 21.50 Médiane: 22.912Mean: 22.79 Moyenne: 23.0483rd Qu:. 28.00 3ème Qu:. 29.519Max. : 44.30 Max. : 37,643

Ensuite, vous utilisez le erreur moyenne de pour cent absolue (mape), Pour mesurer la précision de notre modèle de régression. La formule pour la moyenne de l'erreur absolue est pour cent

(# 931- (| Y-Y '| / | Y |) / N) * 100

où Y est le score réel, Y 'est le score prédit, et N est le nombre de points prévus. Après avoir branché les valeurs dans la formule, vous obtenez une erreur de seulement 10,94 pour cent. Voici le code et la sortie de la console R:

> Mape lt; - (somme (abs (comparaison [1] -Comparaison [2]) / abs (comparaison [1])) / nrow (comparaison)) * 100> mape [1] 10,93689

Le code suivant vous permet de visualiser les résultats et les erreurs dans une vue de tableau:

> MapeTable lt; - cbind (comparaison, abs (comparaison [1] - la comparaison [2]) / comparaison [1], * 100)> colnames (mapeTable) [3] lt; - "Erreur de pour cent absolue"> la tête (mapeTable) réelle pour cent de error2 absolue prédit 15 16,48993 9,9328894 16 18,16543 13,5339525 17 18,39992 8,2348406 15 12,09295 19,3803097 14 11,37966 18,7167088 14 11,66368 16,688031

Voici le code qui vous permet de voir l'erreur pour cent de nouveau:

> Somme (mapeTable [3]) / nrow (comparaison)
 [1] 10,93689

A propos Auteur

Comment préparer les données en r régression pour l'analyse prédictive

Vous devez obtenir les données sous une forme que l'algorithme peut utiliser de construire un modèle analytique prédictive. Pour ce faire, vous avez à prendre un certain temps à comprendre les données et de connaître la structure des…

Comment faire pour exécuter les données d'essai et d'évaluer un modèle d'apprentissage supervisé svm

L'apprentissage supervisé est une tâche d'apprentissage qui apprend à la machine à partir de données d'analyse de prédiction qui ont été marqués. Une façon de penser à propos de l'apprentissage supervisé est que l'étiquetage des…

Comment faire pour exécuter les données de formation dans un modèle d'apprentissage supervisé svm

Avant que vous pouvez nourrir le classificateur Support Vector Machine (SVM) avec les données qui ont été chargés pour l'analyse prédictive, vous devez diviser l'ensemble de données complet en un ensemble de formation et un ensemble de…

Comment utiliser régressions linéaires dans l'analyse prédictive

Régression linéaire est une méthode statistique qui analyse et trouve les relations entre les deux variables. Dans l'analyse prédictive, il peut être utilisé pour prédire une valeur numérique d'une grandeur future.Prenons un exemple de…

De comparaison des symboles du langage C

Si vous écrivez des programmes en C, vous devez utiliser les symboles de comparaison. Les symboles C utilise, leurs significations, et les exemples sont présentés dans le tableau suivant:symboleSignification ou la prononciation“ Vrai ”…

Comment faire une simple comparaison de la programmation de c

Vous faire des comparaisons tout le temps, de sorte que vous ne devriez pas éviter les comparaisons dans la programmation C. Que ferez-vous porter dans la matinée? Faut-il éviter le bureau du projet de loi parce que le réceptionniste dit qu'il…

Stocker des valeurs logiques en C ++

Le résultat d'une opération logique en C ++ peut être affectée à une variable de type bool. Le terme bool se réfère à l'algèbre de Boole, qui est l'algèbre de la logique. Cela a été inventé par un mathématicien britannique, George…

Ajouter javascript opérateurs de comparaison pour état déclarations

javascript utilise les opérateurs de comparaison à l'intérieur conditions de faire des comparaisons numériques ou alphabétiques de variables à d'autres variables ou des valeurs. L'utilisation de ces opérateurs, vous pouvez déterminer si…

Comment évaluer les données linéaires avec r

Naturellement, R fournit un ensemble de différents tests et mesures pour évaluer la façon dont votre modèle correspond à vos données, ainsi que regarder les hypothèses du modèle. Encore une fois, la liste présentée ici est loin d'être…

Comment prédire de nouvelles valeurs de données avec des r

En dehors de décrire les relations, les modèles peuvent également être utilisés pour prédire des valeurs pour de nouvelles données. Pour cela, de nombreux systèmes de modèles en R utilisent la même fonction, idéalement appelé prévoir…

Comment utiliser des prédicats de comparaison et entre dans les états SQL

Typiquement, vous allez utiliser comparaisons SQL prédicats de comparer une valeur avec un autre. Pour chaque ligne dans lequel la comparaison renvoie une valeur Vrai, cette valeur satisfait la OÙ clause, et l'opération (SELECT, METTRE À JOUR,…

Statistiques II pour les nuls

Statistiques II est souvent sur l'analyse de données, et l'astuce est de savoir quand utiliser la méthode d'analyse. Le tableau suivant vous aide à comparer, le contraste, et de décider ce que l'analyse des données à utiliser et quand.…

Testez l'équation de régression estimée en utilisant le coefficient de détermination, r2

Après vous estimez la droite de régression de la population, vous pouvez vérifier si l'équation de régression est logique en utilisant le coefficient de détermination, également connu comme R2 (R au carré). Ceci est utilisé comme une mesure…

Analyse des clients et des périodes de formation et de validation

Une approche sophistiquée et souvent essentiel à l'analyse de séries chronologiques implique le partitionnement des données clients en périodes de formation et de validation. Dans la période de formation, vous construisez une équation de…

godiches.com » Ordinateurs et logiciels » Big Data » La science des données » Comment expliquer les résultats analytiques prédictifs de régression r