Comment créer un dictionnaire de données pour décrire vos données de biostatistique

Chaque base de données de recherche, grandes ou petites, simples ou complexes, doit être accompagnée par un dictionnaire de données qui décrit les variables contenues dans la base de données. Il sera inestimable si la personne qui a créé la base de données ne sera plus là. Un dictionnaire de données est, elle-même, un fichier de données, contenant un enregistrement pour chaque variable dans la base de données.

Pour chaque variable, le dictionnaire doit contenir la plupart des informations suivantes (parfois appelé métadonnées, ce qui signifie "données sur les données"):

  • Un nom de variable à court (généralement pas plus de huit ou dix caractères) qui est utilisé en racontant ce que le logiciel variables que vous voulez utiliser dans une analyse

  • Une description plus verbal de la variable (jusqu'à 50 ou 100 caractères)




  • Le type de données (texte, catégorique, numérique, date / heure, et ainsi de suite)

  • Si numérique: Informations sur la façon dont ce nombre est affiché (le nombre de chiffres avant et après la virgule)

  • Si la date / heure: Comment il est formatée (par exemple, 25/12/13 22h50 ou 22h50 25Dec2013)

  • Si catégorique: Qu'est-ce que les catégories admissibles sont

  • Comment les valeurs manquantes sont représentées dans la base de données (99, 999, «NA», et ainsi de suite)

  • Beaucoup de progiciels statistiques permettent (ou exigent) de spécifier ces informations lorsque vous créez le fichier de toute façon, ils peuvent générer le dictionnaire de données pour vous automatiquement.

    Mais Excel vous permet d'entrer n'importe quoi n'importe où, sans définir formellement les variables, si vous avez besoin pour créer le dictionnaire vous (peut-être une autre feuille de calcul - que vous pouvez appeler "Dictionnaire de données" - dans le même fichier Excel qui contient les données, de sorte que les données dictionnaire reste toujours avec les données).


    » » » » Comment créer un dictionnaire de données pour décrire vos données de biostatistique