Différentes approches de la grande analyse de données

Dans de nombreux cas, grande analyse des données sera représenté à l'utilisateur final à travers des rapports et des visualisations. Parce que les données brutes peuvent être incompréhensiblement variée, vous devrez compter sur les outils et techniques d'analyse pour aider à présenter les données de façon significative.

Sommaire

De nouvelles applications sont disponibles et à venir vont baisser globalement en deux catégories: la coutume ou semi-custom.

Les applications personnalisées pour grande analyse des données

En général, une application personnalisée est créée dans un but précis ou un ensemble connexe de fins. Pour grande analyse des données, le but du développement d'applications personnalisées est d'accélérer le temps de décision ou action.

R environnement

La “ R ” environnement est basée sur la “ S ” statistiques et la langue d'analyse développé dans les années 1990 par les laboratoires Bell. Il est maintenu par le projet GNU et est disponible sous la licence GNU.

Même si la contestation de comprendre pleinement, sa profondeur et sa souplesse en font un choix incontournable pour les développeurs d'applications et de l'analyse “ les utilisateurs de puissance ”. En outre, le projet CRAN R maintient un ensemble mondial de protocole et les serveurs Web de transfert de fichiers avec les versions les plus à jour de l'environnement de R. Une version supportée commercialement entreprise de R est également disponible à partir de la Révolution Analytics.

Plus précisément, R est une suite intégrée d'outils logiciels et de technologies conçues pour créer des applications personnalisées utilisées pour faciliter la manipulation de données, le calcul, l'analyse et l'affichage visuel. Parmi les autres fonctionnalités avancées, il prend en charge

  • Le traitement des données et de manipulation des composants efficaces.

  • Opérateurs pour les calculs sur des tableaux et d'autres types de données ordonnées.




  • Outils spécifiques à une grande variété d'analyses de données.

  • Des capacités avancées de visualisation.

  • Langage de programmation S conçu par des programmeurs, des programmeurs avec de nombreuses constructions familiers, y compris conditionnelles, boucles, fonctions récursives définies par l'utilisateur, et une large gamme d'équipements d'entrée et de sortie.

R est bien adapté à usage unique, des applications personnalisées pour l'analyse des sources de données de grandes.

Google Prediction API

L'API Google Prediction est un exemple d'une nouvelle classe de grands outils d'application d'analyse de données. Il est disponible sur le site de Google pour les développeurs et est bien documenté et doté de plusieurs mécanismes d'accès à l'aide de différents langages de programmation. Pour vous aider à démarrer, il est librement disponible pour six mois.

L'API de prévision est assez simple. Il recherche des modèles et les associe à proscriptives, normatives, ou d'autres modèles existants. Tout en accomplissant sa correspondance de motif, il a également “ apprend ”. Plus vous l'utilisez, plus intelligent qu'il obtient.

Prédiction est implémenté comme une API RESTful avec le soutien de langue pour .NET, Java, PHP, javascript, Python, Ruby, et beaucoup d'autres. Google fournit également des scripts pour accéder à l'API ainsi que d'une bibliothèque cliente pour R.

Analyse prédictive est une des plus puissantes capacités les potentiels de gros volumes de données, et l'API Google Prediction est un outil très utile pour créer des applications personnalisées.

Applications semi-personnalisés pour grande analyse de données

En vérité, ce que beaucoup de gens perçoivent comme des applications personnalisées sont effectivement créés à l'aide “ emballé ” ou des composants tiers comme les bibliothèques. Il est pas toujours nécessaire de coder entièrement une nouvelle application. Utilisation des applications ou composants emballés exige des développeurs ou analystes écrire du code pour “ tricoter ensemble ” ces composants dans une application personnalisée de travail. Voici les raisons pour lesquelles cela est une bonne approche:

  • Vitesse de déploiement: Parce que vous ne devez pas écrire chaque partie de l'application, le temps de développement peut être considérablement réduit.

  • Stabilité: Utilisation de bien construits, fiables, des composants tiers peut aider à rendre l'application personnalisée plus résilient.

  • Meilleure qualité: Composants emballés sont souvent soumis à des normes de qualité plus élevés parce qu'ils sont déployés dans une grande variété d'environnements et domaines.

  • Plus de flexibilité: Si une meilleure composante vient le long, il peut être échangé dans l'application, l'extension de la durée de vie, l'adaptabilité et l'utilité de l'application personnalisée.

Un autre type d'application semi-custom est celui où le code source est disponible et est modifié pour un usage particulier. Cela peut être une approche efficace car il ya quelques exemples de blocs de construction d'application disponibles à intégrer dans votre application semi-custom:

  • TA-Lib: La bibliothèque Analyse technique est largement utilisée par les développeurs de logiciels qui ont besoin d'effectuer une analyse technique des données sur les marchés financiers. Il est disponible en open source sous la licence BSD, ce qui lui permet d'être intégré dans des applications semi-personnalisés.

  • JUNG: Le cadre Réseau Graphique Java Universal est une bibliothèque qui fournit un cadre commun pour l'analyse et la visualisation de données qui peut être représenté par un graphique ou d'un réseau. Il est utile pour l'analyse de réseau social, des mesures d'importance, et l'exploration de données. Il est disponible en open source sous la licence BSD.

  • GeoTools: Une boîte à outils open source géospatiales pour manipuler des données SIG sous de nombreuses formes, l'analyse des attributs spatiales et non-spatiales ou des données SIG, et de créer des graphiques et des réseaux de données. Il est disponible sous la licence GPL2, permettant une intégration dans des applications semi-personnalisés.


» » » » Différentes approches de la grande analyse de données