Comment analyser les données dans des tables avec des r

Vous pouvez utiliser les R prop.test ()

Sommaire

fonction des données dans des matrices et des tableaux. Pour prop.test (), ces tables doivent avoir deux colonnes avec le nombre de coups pour les deux résultats possibles.

Comment tester contingence de tables

Alternativement, vous pouvez utiliser le chisq.test () fonction d'analyser les tables avec un chi-carré (# 967-2) Test de contingence. Pour ce faire sur la matrice avec les données de ceinture de sécurité, il vous suffit de faire ce qui suit:

> Chisq.test (seatbelt.table)

Cela renvoie la sortie suivante:

 Test du chi-carré de Pearson avec une continuité de correctiondata Yates: survivorsX-carré = 24,3328, df = 1, p = 8.105e-07



Les valeurs de la statistique (X-squared), Les degrés de liberté, et la valeur de p sont exactement les mêmes que pour la prop.test () fonction. Cela est normal, parce que - dans ce cas, au moins - deux tests sont équivalentes.

Comment tester tables avec plus de deux colonnes

Contrairement à la prop.test () fonction, la chisq.test () fonction peut traiter avec des tables avec plus de deux colonnes et même avec plus de deux dimensions. Pour illustrer cela, nous allons jeter un oeil à la table HairEyeColor. Vous pouvez voir sa structure avec le code suivant:

> Str (HairEyeColor) Tableau [1: 4, 1: 4, 1: 2] 10 3 32 53 11 50 10 30 10 25 ...- attr (*, "dimnames") = Liste des 3 .. $ cheveux: chr [1: 4] «Noir» "Brown" "Rouge" "Blond" .. $ yeux: chr [1: 4] "Brown" "Blue" "Hazel" "Green" .. $ Sexe: chr [1: 2] "Homme" "Femme"

Ainsi, la table HairEyeColor a trois dimensions: l'une pour la couleur des cheveux, une pour la couleur des yeux, et une pour le sexe. Le tableau représente la distribution de ces trois fonctionnalités parmi les 592 élèves.

Les noms de dimension d'une table sont stockés dans un attribut appelé dimnames. Comme vous pouvez le voir sur la sortie du str () fonction, cela est effectivement une liste avec les noms pour les lignes / colonnes dans chaque dimension. Si cette liste est une liste nommée, les noms sont utilisés pour marquer les dimensions. Vous pouvez utiliser le dimnames () fonction d'extraire ou de modifier les noms de dimension.

Pour vérifier si la couleur des cheveux et la couleur des yeux sont liés, vous pouvez réduire la table au cours des deux premières dimensions en utilisant le margin.table () fonctionner de résumer les cheveux et la couleur des yeux pour les deux sexes. Cette fonction additionne les valeurs de certaines dimensions de vous donner un tableau récapitulatif avec moins dimensions. Pour cela, vous devez spécifier les marges que vous souhaitez conserver.

Donc, pour obtenir le tableau de cheveux et la couleur des yeux, vous utilisez ce qui suit:

> HairEyeMargin lt; - margin.table (HairEyeColor, la marge = c (1,2))> HairEyeMarginEyeHair Marron Bleu Noisette Greenblack 68 20 15 119 84 54 5Brown 29Red 26 17 14 7 94 10 14Blond 16

Maintenant vous pouvez simplement vérifier si les cheveux et la couleur des yeux sont liées en le testant sur ce tableau:

> Chisq.test testdata de (HairEyeMargin) Pearson Chi-squared: HairEyeMarginX-carré = 138,2898, df = 9, p-valeur lt; 2.2e-16

Comme prévu, la sortie de ce test vous indique que certaines combinaisons de cheveux et la couleur des yeux sont plus fréquents que d'autres. Pas une grande surprise, mais vous pouvez utiliser ces techniques sur d'autres questions de recherche les plus intéressants,.


» » » » Comment analyser les données dans des tables avec des r