10 conseils sur l'utilisation des paquets de r

Une des caractéristiques très attractifs de R est qu'il contient une grande collection de tiers forfaits

Sommaire

(collections de fonctions dans un format bien défini). Pour tirer le meilleur parti de R, vous devez comprendre où trouver les paquets supplémentaires, comment télécharger et les installer, et comment les utiliser.

Farfouillé les coins et recoins de CRAN

Le Comprehensive R Archive Network (CRAN) est un réseau de serveurs web dans le monde où vous pouvez trouver le code source de R, R manuels et de la documentation, et contribué paquets.

CRAN a pas un seul site web- il est une collection de serveurs web, chacun avec une copie identique de toutes les informations sur CRAN. Ainsi, chaque serveur web est appelé miroir. L'idée est que vous choisissez le miroir qui se trouve le plus proche de l'endroit où vous êtes, ce qui réduit le trafic international ou longue distance Internet. Vous pouvez trouver une liste des CRAN reflète ici.

Quelle que soit la R interface que vous utilisez, vous pouvez enregistrer votre permanence miroir CRAN préférée (et d'autres paramètres) dans un fichier spécial appelé .RProfile, situé dans le répertoire personnel de l'utilisateur ou le répertoire R de démarrage. Par exemple, pour régler le miroir de l'Imperial College, au Royaume-Uni en tant que votre défaut miroir CRAN, inclure cette ligne dans votre .RProfile:

options (“ Repos ” = C (CRAN = “ http: //cran.ma.imperial.ac.uk/#148;))

Trouver des forfaits intéressants

Au début de 2015, il y avait plus de 6000 paquets sur CRAN. Cela signifie trouver un paquet pour votre tâche à accomplir peut sembler difficile.

Heureusement, une poignée d'experts bénévoles ont rassemblé quelques-uns des forfaits les plus largement utilisés dans des listes le commissariat. Ces listes sont appelées tâches vues CRAN. Vous pouvez trouver des vues de tâches pour finance empirique, statistique génétique, l'apprentissage machine, apprentissage statistique, et de nombreux autres sujets fascinants.

Chaque paquet possède sa propre page web sur CRAN. Sur la page web pour un paquet, vous trouverez un résumé, des informations sur les paquets qui sont utilisés, un lien vers le site de l'emballage (si un tel site existe), et d'autres informations utiles.

Installation de paquets

Pour installer un paquet utiliser le install.packages () fonction. Cette simple commande télécharge le package à partir d'un référentiel spécifié (par défaut, CRAN) et l'installe sur votre machine:

 > Install.packages (“ fortunes ° 148);

Notez que l'argument de install.packages () est une chaîne de caractères. En d'autres termes, se rappeler les guillemets autour du nom du paquet!

Dans RGui, ainsi que dans rstudio, vous trouverez une commande de menu pour faire la même chose:

  • Dans RGui, choisissez forfaits-Installer le paquet (s).

  • Dans rstudio, choisissez Outils-Installer les paquets. . . .

Forfaits de chargement

Pour charger un package, vous utilisez le bibliothèque () ou require () fonction. Ces fonctions sont identiques dans leurs effets, mais ils diffèrent dans la valeur de retour:

  • bibliothèque (): Invisiblement retourne une liste de paquets qui sont attachés, ou arrête avec une erreur si l'emballage ne sont pas sur votre machine.

  • require (): Retours VRAI si le paquet a été attaché avec succès et FAUX si non.




La documentation de R suggère que bibliothèque () est la meilleure façon de forfaits de chargement dans les scripts, tandis que require () est préféré dans les fonctions et forfaits.

Ainsi, après l'installation du paquet fortunes vous chargez comme ceci:

> Bibliothèque (“ fortunes ° 148);

Notez que vous ne disposez pas de citer le nom du package dans l'argument de bibliothèque (), mais il est de bonne pratique de toujours citer le nom du package.

Bien qu'il soit possible de décharger un paquet dans une session en utilisant le R détacher () fonction, en pratique, il est généralement beaucoup plus facile de simplement redémarrer votre session R.

Lire le manuel de l'emballage et vignette

Le manuel d'ensemble est une collection de toutes les fonctions et d'autres documents de l'emballage. Vous pouvez accéder au manuel de deux façons. La première façon consiste à utiliser la Aidez-moi argument de la bibliothèque () fonction:

> Bibliothèque (aide = “ fortunes ”)

La deuxième façon est de trouver le manuel sur le site Web de l'emballage. Si vous pointez votre fenêtre de navigateur à la page CRAN pour le paquet fortunes, vous remarquerez un lien vers le manuel vers le bas de la page.

Quelle que soit l'approche choisie, le résultat est un document PDF contenant le manuel de l'emballage.

Certains auteurs de l'emballage également écrire un ou plusieurs vignettes, documents qui illustrent comment utiliser le paquet. Une vignette montre typiquement quelques exemples de la façon d'utiliser les fonctions et la manière de démarrer. L'essentiel est que une vignette illustre comment utiliser le paquet avec le code de R et de sortie, tout comme ce livre.

Pour lire la vignette pour la fortunes paquet, essayez ce qui suit:

> Vignette (“ fortunes ° 148);

Mise à jour des forfaits

Pour vous assurer que vous disposez de la dernière version d'un paquet, utilisez (update.packages):

()> Update.packages

Cette fonction se connecte à CRAN (par défaut) et vérifie si il ya des mises à jour pour tous les paquets que vous avez installé sur votre machine. Si il ya, il vous demande si vous souhaitez mettre à jour chaque paquet, puis télécharge le code et installe la nouvelle version.

Si vous ajoutez update.packages (demandez = FALSE), R met à jour tous les paquets sur-of-date dans l'emplacement bibliothèque actuelle, sans vous demander. En outre, vous pouvez dire (update.packages) de regarder un autre dépôt de CRAN en changeant la Repos argument. Si le Repos points d'argument pour un fichier sur votre machine (ou réseau), R installe le package à partir de ce fichier.

Les deux RGui et rstudio ont des options de menu qui vous permettent de mettre à jour les paquets:

  • Dans RGui, choisissez paquet (s) Paquets-Update.

  • Dans rstudio, choisissez Outils-Check for Updates emballage. . . .

Les deux applications vous permettent de choisir graphiquement les paquets à mettre à jour.

Aller de l'avant avec le R-Forge

Bien que pas universellement vrai, forfaits sur CRAN ont tendance à avoir un niveau minimum de maturité.

Alors, où ne vivent que des paquets sont dans le cycle de développement? Très souvent, ils vivent au R-Forge. R-Forge donne aux développeurs une plate-forme pour développer et tester leurs packages R. Par exemple, R-Forge offres

  • Un système de construction et de contrôle sur les systèmes d'exploitation Windows et Linux (Mac OSX est pas pris en charge)

  • Le contrôle de version

  • Systèmes rapport de bug

  • Sauvegarde et administration

Pour installer un projet de R-Forge, vous utilisez aussi le install.packages () fonctionner, mais vous devez spécifier le Repos argument. Par exemple, pour installer la version de développement de l'emballage data.table, essayez ce qui suit:

> Install.packages (“ data.table ” ;, repos = “ http: //R-Forge.R-project.org#148;)

Bien que R-Forge n'a pas de construction et vérifier le système pour Mac OSX spécifiquement, les utilisateurs Mac peuvent installer et utiliser des packages de R-Forge en installant le paquet source. Vous trouverez plus d'informations dans la FAQ pour Mac.

Obtenir des paquetages de github

Au cours des dernières années, de nombreux développeurs ont commencé à utiliser github comme un site de développement de code. Bien github ne propose pas les fonctionnalités spécifiques de R CRAN ou R-Forge, parfois du code est plus facile de partager en utilisant github. Ainsi, vous pouvez parfois obtenir des instructions pour installer un package directement à partir de GitHub.

Sur les systèmes Linux et Mac OSX d'exploitation, installer des paquets de github est relativement facile. Cependant, sous Windows, vous devez d'abord installer également RTools (un ensemble de compilateurs et autres outils pour construire des paquets de source). Pour installer RTools sur une machine Windows, suivez attentivement les instructions.

Mener des installations de BioConductor

BioConductor est un référentiel de packages R et des logiciels, une collection d'outils qui se spécialise dans l'analyse des données génomiques et connexes.

BioConductor a ses propres ensembles de règles pour les développeurs. Par exemple, pour installer un paquet depuis BioConductor vous avez à la source d'un script à partir de son serveur:

> Source (“ http: //bioconductor.org/biocLite.R#148;)

Ensuite, vous pouvez utiliser la biocLite () fonction pour installer des paquets depuis BioConductor. Si vous ne fournissez pas un argument, vous installez simplement les paquets de base nécessaires du projet de BioConductor.

BioConductor utilise intensivement la programmation orienté objet avec des classes S4.

Lire le manuel de R

La “ R Installation et administration ” manuel est un guide complet de l'installation et l'administration de R. chapitre 6 de ce manuel contient toutes les informations dont vous avez besoin de travailler avec des paquets.


» » » » 10 conseils sur l'utilisation des paquets de r