Comment prédire de nouvelles valeurs de données avec des r

En dehors de décrire les relations, les modèles peuvent également être utilisés pour prédire des valeurs pour de nouvelles données. Pour cela, de nombreux systèmes de modèles en R utilisent la même fonction, idéalement appelé prévoir ()

Sommaire

. Chaque paradigme de modélisation en R a une fonction prédire avec sa propre saveur, mais en général, la fonctionnalité de base est la même pour chacun d'eux.

Comment faire pour obtenir les valeurs de données

Par exemple, un constructeur automobile a trois modèles pour une nouvelle voiture et veut savoir ce que le kilométrage prévu est fondé sur le poids de chaque nouvelle conception. Pour ce faire, vous créez d'abord une trame de données avec les nouvelles valeurs - par exemple, comme ceci:

> New.cars lt; - data.frame (poids = c (1.7, 2.4, 3.6))



Assurez-vous toujours les noms de variables que vous utilisez sont les mêmes que ceux utilisés dans le modèle. Quand vous faites cela, vous appelez simplement le prévoir () fonctionner avec les arguments adaptés, comme ceci:

> Prévoir (Modèle, newdata = new.cars) 12,328,19952 24,45839 18,04503

Donc, la voiture la plus légère a un kilométrage prévu de 28,2 miles par gallon et la voiture la plus lourde a prédit un kilométrage de 18 miles par gallon, selon ce modèle. Bien sûr, si vous utilisez un modèle inadéquat, vos prédictions peuvent être à peu près hors ainsi.

La confiance dans vos prédictions

Afin d'avoir une idée de la précision des prévisions, vous pouvez demander à des intervalles autour de votre prédiction. Pour obtenir une matrice avec la prédiction et un intervalle de confiance de 95 pour cent autour de la prédiction moyenne, vous définissez l'argument intervalle à «confiance» comme ça:

> Prévoir (Modèle, newdata = new.cars, intervalle = «confiance») lwr ajustement UPR1 28,19952 26,14755 30,251502 24,45839 23,01617 25,900623 18,04503 16,86172 19,22834

Maintenant, vous savez que - selon votre modèle - une voiture avec un poids de 2,4 tonnes a, en moyenne, un kilométrage entre 23 et 25,9 miles par gallon. De la même façon, vous pouvez demander un intervalle de prédiction de 95 pour cent par réglage de l'intervalle de argument «prédiction»:

> Prévoir (Modèle, newdata = new.cars, intervalle = «prédiction») lwr ajustement UPR1 28,19952 21,64930 34,749752 24,45839 18,07287 30,843923 18,04503 11,71296 24,37710

Cette information vous indique que 95 pour cent des voitures avec un poids de 2,4 tonnes ont un kilométrage quelque part entre 18,1 et 30,8 miles par gallon - en supposant que votre modèle est correct, bien sûr.

Si vous préférez construire votre propre intervalle de confiance, vous pouvez obtenir les erreurs standard sur vos prédictions ainsi en réglant l'argument se.fit à VRAI. Vous ne recevez pas un vecteur ou une matrice-place, vous obtenez une liste avec un élément s'adapter qui contient les prédictions et un élément se.fit qui contient les erreurs-types.


» » » » Comment prédire de nouvelles valeurs de données avec des r