Comment saisir les données de date et d'heure pour biostatistique

Lorsque vous entrez des données numériques dans votre ordinateur, Don't combiner deux numéros en une seule variable (comme 145/85 pour systolique et la pression artérielle diastolique). Quand il vient à dates et heures, cependant, exactement le contraire qui est vrai!

La plupart des logiciels statistiques peut représenter dates et heures comme une variable unique (un "instantané" sur un calendrier continu), afin de profiter de ce que si vous pouvez - entrez la date et l'heure comme une variable (par exemple, 07/15/2010 08 : 23), et non comme une variable de date et une variable de temps.

Cette méthode est particulièrement utile lorsque face aux événements qui se déroulent sur un court intervalle de temps (comme les événements survenus pendant le travail et l'accouchement).

La plupart des programmes statistiques Date de magasin et de temps en interne comme un nombre, en précisant le nombre de jours (et des fractions de jours) de certains arbitraire «date zéro." Voici les dates zéro pour quelques programmes communs:

  • Excel: Minuit au début du 31 Décembre, 1899 (ceci est également le plus tôt que Excel peut stocker). Donc, 21 Novembre 2012, à 18h00, est stocké en interne comme 41,234.75 (le 0,75 est parce que 18 heures est de 3/4 du chemin à travers ce jour-là).




  • SPSS: 14 octobre 1582 (la date du calendrier grégorien a été adopté pour remplacer le calendrier julien).

  • SAS: 01/01/1960 (une date totalement arbitraire).

Certains programmes peuvent stocker une date et l'heure comme un Julian Date, dont le zéro est produite à midi, heure de Greenwich, le 1er janvier 4713 avant JC. (Rien de spécial est arrivé à cette date- 'il a été choisi à l'origine purement commodité numérique.)

Que faire si vous ne connaissez pas le jour du mois? Cela arrive souvent avec des antécédents médicaux Items--vous entendu quelque chose comme "Je suis la grippe en Septembre 2004." La plupart des logiciels insiste qu'une variable de date soit une date complète et ne sera pas accepter juste un mois et un an.

Dans ce cas, un argument peut être faite pour régler le jour à 15 (vers la mi-mois), sur les motifs que l'erreur est également susceptible d'être de chaque côté et tend à annuler, en moyenne donc. De même, si les deux mois et le jour sont manquantes, vous pouvez les mettre à 30 ou 1 Juin Juillet (vers la mi-année) pour atteindre le même genre d'annulation d'erreur moyenne.

Si seulement certains enregistrements ont des dates partielles, vous pouvez créer une autre variable pour indiquer si la date est complète ou partielle, de sorte que vous pouvez dire, si vous devez, si 15/09/2004 signifie bien 15 Septembre, 2004, ou tout simplement septembre 2004.

Complètement dates manquantes devraient généralement juste être laissés blank- plupart des friandises de logiciels statistiques des cellules vides de données comme manquantes.

En raison de la façon dont la plupart des programmes statistiques stocker les dates et heures, ils peuvent facilement calculer les intervalles entre deux points dans le temps par ce qu'on appelle "le calendrier arithmétique», que vous pourriez indiquer comme une simple soustraction. Donc, il est généralement plus facile et plus sûr d'entrer les dates et heures et de laisser l'ordinateur de calculer les intervalles entre eux que pour calculer les intervalles vous-même.

Par exemple, si vous créez des variables pour la date de naissance (DOB) Et une date de visite (VisDt) dans Excel, vous pouvez souvent avez Excel calculer une très précis l'âge au moment de la visite avec cette formule simple:

Age = (VisDt - DOB) /365.25

De même, dans les études de cancer, vous pouvez facilement et précisément calculer les intervalles de diagnostic ou de traitement à la remise et la récurrence, ainsi que la durée de survie totale, à partir des dates des événements correspondants.


» » » » Comment saisir les données de date et d'heure pour biostatistique