10 ressources gratuites pour les sciences de données

Une excellente chose de la science des données est que vous ne devez pas dépenser beaucoup d'argent sur les applications logicielles et les données sources afin de commencer à récolter ses avantages. Vous pouvez tout simplement commencer avec vos propres données et commencer à utiliser les applications open source ou langages de programmation afin de commencer à tirer des indications précieuses.

Sommaire

Même les données contextuelles peuvent être recueillies gratuitement à partir de sources de données ouvertes. Il est probable que vous obtiendrez de meilleurs résultats, plus exactes (avec moins d'effort) si vous avez de l'argent à dépenser pour des outils coûteux et sources de données ciblées exacte, mais cela ne constitue pas une exigence absolue par tout moyen.

Bon nombre des ressources présentées ici sont mis à disposition dans le cadre de la contribution de l'organisation un don à la mouvement open - un mouvement qui prône le libre échange de la propriété intellectuelle dans les domaines de l'art, l'éducation, les logiciels, les données, et de la technologie, entre autres. Trois principales composantes du mouvement open sont données open, open source, et de la connaissance ouverte.

Open data initiatives sont fondées sur le principe que les données doivent être effectuées librement et ouvertement à la disposition du grand public pour l'utilisation, la réutilisation et la republication. Ouvrir les données pourraient être émises sous une sorte de condition de licence ouverte, mais il est généralement libre de droits d'auteur et de brevets restrictions.

La Open source mouvement du logiciel a commencé à la fin des années 1970 et est basée sur la prémisse que les utilisateurs de logiciels devraient être en mesure de partager librement les logiciels. Le mouvement open source préconise également que les développeurs devraient être autorisés à construire open-source dérivé ou des œuvres de propriété sur elle.

Enfin, la la connaissance ouverte le mouvement se positionne au-dessus des autres mouvements ouverts et énonce l'idée que la connaissance sous toutes ses formes doit être faite librement et ouvertement à la disposition du grand public. Le mouvement de la connaissance ouverte préconise également que les gens devraient être libres d'utiliser, réutiliser, partager, et republier ces connaissances.

Accéder aux données ouverte par Open Knowledge




Le plus grand promoteur du mouvement de la connaissance ouverte est l'organisation à but non lucratif, Open Knowledge. Cette organisation définit la connaissance ouverte que les indications utiles, utiles et précieuses provenant de sources de données ouvertes. Le site web de Open Knowledge est une source formidable pour rencontrer et de collaborer avec les données ouvertes et passionnés de sciences de données.

Trouver les données gratuites chez Open de la Banque mondiale de données

Banque mondiale Open Data est une source incroyablement robuste de données et les données démographiques sur les pays en développement. Les sujets traités comprennent la santé, l'infrastructure, la pauvreté, le commerce, le développement urbain, l'agriculture et le développement rural et l'environnement, parmi beaucoup d'autres. Les données sur les indicateurs les mesures de la Banque mondiale sont également rendues publiques. Ce sont une grande base sur laquelle faire une analyse comparative entre les nations en développement.

Libre Source des données spatiales de OpenStreetMap

OpenStreetMap (OSM) est une excellente source de données géographiques libres, ouvertes que vous pouvez utiliser pour analyser des données dans les systèmes d'information géographique (SIG) ou pour développer des applications web de géolocalisation. À la page OSM Export vous pouvez télécharger la base de données entière (massive) des données spatiales OSM. (Pour télécharger des extraits de données à partir de seulement les continents, pays et villes que vous souhaitez, nous vous invitons à utiliser les Téléchargements Geofabrik option- vous pouvez également utiliser Metro Extraits de l'OSM disposent pour télécharger les données sur métropolitaine plus grandes villes du monde.)

Recueillir des données libres du gouvernement de Data.gov

Data.gov est une formidable source si vous êtes à la recherche pour les données gratuitement sur affaires, l'environnement, la santé publique, et de la recherche et développement (RD) aux Etats-Unis. Data.gov est génial parce que, en plus de jeux de données tabulaires standard, il offre également des sources de données spatiales que vous pouvez télécharger et utiliser pour l'analyse dans les SIG.

Calculer avec des langages nés du mouvement open source

Sciences de données langages de programmation conviviale, comme R et Python sont open source et gratuit à utiliser pour l'analyse ou le développement d'applications. Les deux langues sont idéales pour l'analyse des données et la visualisation. R a l'avantage d'offrir des capacités statistiques et de données plus sophistiquées visualisation, tandis que l'avantage de Python est qu'il est beaucoup plus facile à apprendre que R.

Analyser les données gratuitement avec l'application Applied Data

Si vous ne souhaitez pas utiliser de code à écrire des routines personnalisées pour votre analyse, vous pourriez choisir d'utiliser une application Web gratuite à la place. Applied Data offre des fonctionnalités robustes pour la création de tableaux croisés dynamiques, des cartes d'arbres, et les prévisions prédictifs. Il a également obtenu des fonctionnalités que vous pouvez utiliser pour la corrélation, aberrante, et l'analyse de l'association.

Assurez-cartes avec GeoCommons

GeoCommons est une application de cartographie sur le Web gratuitement. Son trait le plus saillant est l'intégration de graphiques connexes et les fonctionnalités de Google Earth. Avec GeoCommons, vous pouvez télécharger des données et automatiquement géocoder vos identifiants. Vous avez le choix de la visualisation des données en utilisant un chloroplèthe (pour lequel vous pouvez concevoir un certain nombre de régimes de coloration automatisés ou manuels) ou la visualisation de données utilisant des bulles et des marqueurs (comme les drapeaux et les gouttelettes qui transmettent les données par taille ou par couleur).

GeoCommons vous permet également d'insérer un graphique simple ligne, graphique à barres, histogramme ou diagramme de dispersion (généralement pas de quelque chose qui est facile à faire sur une carte) pour montrer la relation entre deux variables quantitatives. Enfin, GeoCommons intègre marqueurs ou région catégorique visualisations avec Google Earth afin que vous puissiez voir vos données spatiales sur une rotative, représentation sphérique, zoom-mesure de la planète. (Notez que, pour pouvoir utiliser cette fonctionnalité, vous devez installer le plug-in Google Earth.)

Assurez-cartes avec Datawrapper

Datawrapper est un outil gratuit open-source que vous pouvez utiliser pour créer des visualisations simples. Il a deux caractéristiques ne trouve pas ailleurs - un graphique de données Élection Donut qui ressemble à la disposition des différentes maisons de parlement ou congrès, et une fonctionnalité de mise en surbrillance facile que vous pouvez utiliser pour mettre l'accent sur le cœur de l'importance de la visualisation de données en mettant en évidence un seul point de données dans un graphique . Datawrapper propose les choix suivants dans les données type de graphique: graphiques Colonne, camemberts, graphiques en anneau, graphiques élection de beignes, des cartes et des diagrammes à barres.

Assurez infographies interactives cool avec Infoactive.co

Infoactive.co est un faible coût, l'application de conception de visualisation de données sur le Web. Il offre un modèle attractif soulignant ceux minimaliste “-design plat ” texte et visualisations qui sont à la mode ces jours-ci. L'application dispose de capacités d'ajouter des événements de souris-over, le filtrage des données, et même des connexions de données à Live-mise à jour, les sources en ligne telles que Google Documents.

Connexion de votre Infoactive.co infographie à des données qui est stocké dans une feuille Google peut produire des résultats dynamiques. Chaque fois que la feuille est mise à jour, la mise à jour de visualisation Infoactive est en même temps.

Infoactive.co offre beaucoup de choix dans le type graphique de données - y compris histogrammes, camemberts, graphiques en anneau, icônes de pourcentage, des graphiques linéaires, des tableaux de la région, des cartes et des diagrammes à barres. Aussi, tout comme une petite friandise à propos Infoactive.co - le démarrage est né à la suite d'une campagne Kickstarter succès !! Cela va juste pour montrer que vous pouvez jamais vraiment prédire d'où le succès sera né.

Tableau avec ChartBuilder

ChartBuilder est étonnant car il est encore plus facile de créer des graphiques dans l'application de ChartBuilder que dans Microsoft Excel. Qui plus est, les cartes ChartBuilder peuvent être plus attrayant et d'allure professionnelle que ceux conçus dans l'application Excel standard. Vous pouvez utiliser ChartBuilder gratuitement pour faire des graphiques linéaires, histogrammes, diagrammes à barres et des diagrammes de dispersion.

Qui plus est, l'application vous permet de faire des opérations de copier-coller facile d'importer vos données, puis générer des résultats exploitables en quelques secondes. Bien que le site ne propose pas de capacités de stockage de données, vos visualisations peuvent être téléchargés en un seul clic, soit comme des images bitmap ou vectoriel SVG graphiques.


» » » » 10 ressources gratuites pour les sciences de données