Données d'étiquetage

Utilisation des codes pour les données réduit le temps de saisie des données, éviter les erreurs et réduit les besoins en mémoire pour stocker les données. Mais les codes ne sont pas significatives, sauf si vous avez de la documentation, ou étiquettes

Sommaire

, pour expliquer leur signification.

Certains formats de données vous permettent de profiter des avantages de l'utilisation des codes tout en gardant les informations sur la signification des codes dans le même fichier. Ce ne sont pas typique dans l'extraction de données - vous êtes plus susceptible de les voir dans les produits d'analyse statistique - mais certaines applications d'exploration de données peuvent utiliser ces formats de données étiquetées. Voici comment ils fonctionnent.

Données d'étiquetage
Données d'étiquetage Agrandir
1

Données semble contenir seulement des chiffres, mais ces chiffres sont des codes pour les valeurs des variables catégoriques.




Cette base de données est ouvert dans l'application de l'analyse statistique RRF.

Données d'étiquetage
Données d'étiquetage Agrandir
2

Le même ensemble de données avec des étiquettes à la place de codes numériques.

Vous pouvez basculer entre ces deux options d'affichage en utilisant le menu.

Données d'étiquetage
Données d'étiquetage Agrandir
3

Bien que les données sont stockées sous forme de nombres, les étiquettes vous permettent de voir ce qui signifie que les données.

Dans la figure, vous êtes à la recherche dans l'éditeur de données. Vous pouvez également mettre en place une analyse ou voir les résultats.

Données d'étiquetage
Données d'étiquetage Agrandir
4

Vous pouvez inclure des commentaires dans un ensemble de données.

Vous pouvez également trouver d'autres types d'étiquettes de données dans les applications de data mining. Le format de données natif pour Weka vous permet d'inclure des commentaires dans un ensemble de données. Cela vous donne un bon endroit pour mettre des annotations sur la source des données et d'autres détails importants.

Données d'étiquetage
Données d'étiquetage Agrandir
5

Vous pouvez annoter des données.

RapidMiner a également une option pour les annotations. Vous pouvez utiliser l'interface utilisateur graphique pour entrer annotations pour les lignes de données individuelles.