Comment créer un tableau de données dans les deux sens avec r

UN tableau à double entrée

Sommaire

est un tableau qui décrit deux variables de données catégoriques ensemble, et R vous donne toute une panoplie d'outils pour travailler avec des tables à deux voies. Elles contiennent le nombre de cas pour chaque combinaison de ces catégories dans les deux variables. L'analyse des données catégoriques commence toujours avec des tables. Mais d'abord, vous devez créer les tables.

Comment créer un tableau de données à partir de deux variables R

Par exemple, vous voulez savoir combien de voitures ont trois, quatre ou cinq vitesses, mais scindé aux voitures avec des boîtes de vitesse automatiques et les voitures avec boîte de vitesses manuelle. Vous pouvez le faire à nouveau avec l'aide de la table() fonction avec deux arguments, comme ceci:

> (Avec les voitures, table (AM, engins)) 3 4 0 8 5manual 5auto 15 4 0

Les niveaux de la variable que vous donnez comme premier argument sont les noms de lignes, et les niveaux de la variable que vous donnez comme second argument sont les noms de colonnes. Dans le tableau, vous obtenez les chiffres pour chaque combinaison. Par exemple, vous pouvez compter 15 voitures avec boîtes de vitesses manuelles et trois engrenages.

Comment faire pour créer des tableaux de données R à partir d'une matrice

Les chercheurs utilisent aussi des tables pour les affaires plus graves, comme pour découvrir si un certain comportement (comme le tabagisme) a un impact sur le risque de contracter une maladie (par exemple, le cancer du poumon). De cette façon, vous avez quatre cas possibles: les comportements à risque et les malades, les comportements à risque et en bonne santé, pas de comportements à risque et en bonne santé, ou pas de comportements à risque et les malades.




Souvent le résultat d'une telle étude se compose des chefs d'accusation pour chaque combinaison. Si vous avez les chiffres pour chaque cas, vous pouvez très facilement créer la table vous-même, comme ceci:

> Essai lt; - matrice (c (34,11,9,32), ncol = 2)> colnames (essai) lt; - c («malade», «sain»)> rownames (essai) lt; - c ('risque', 'no_risk')> trial.table lt; - as.table (essai)

Avec ce code, vous effectuez les opérations suivantes:

  1. Créer une matrice avec le nombre de cas pour chaque combinaison de pas de comportement de maladie / santé et le risque / risque.

  2. Ajouter les noms de colonnes de souligner dans quelle catégorie les chiffres sont pour.

  3. Convertir cette matrice à une table.

Le résultat ressemble à ceci:

> Trial.tablesick healthyrisk 349no_risk 11 32

Une table comme trial.table peut être vu comme un résumé de deux variables. Une variable indique si la personne est malade ou en bonne santé, et l'autre variable indique si la personne présente un comportement risqué.

Comment pour extraire les données par R

Bien que les tables et les matrices sont deux bêtes différentes, vous pouvez traiter une table dans les deux sens comme une matrice dans la plupart des situations. Cela devient très pratique si vous voulez extraire les valeurs de la table. Si vous voulez savoir combien de personnes ont été malades et ont montré un comportement à risque, vous faites simplement ce qui suit:

> Trial.table [«risque», «malade»] [1] 34

» » » » Comment créer un tableau de données dans les deux sens avec r