Allez dehors de la norme avec les statistiques non paramétriques

Tous les tests statistiques sont calculées sur la base de certaines hypothèses sur vos données, et la plupart des tests de signification classiques (tels que test t de Student, l'analyse de la variance, et les tests de régression) supposent que vos données sont réparties selon une certaine distribution de fréquence classique ( le plus souvent la distribution normale).

Parce que les fonctions de distribution classiques sont toutes écrites comme des expressions mathématiques impliquant des paramètres (comme moyens et écart-type), ils sont appelés paramétrique des fonctions de distribution, et des essais qui assument vos données est conforme à une fonction de distribution paramétrique sont appelés tests paramétriques. Parce que la distribution normale est la distribution statistique la plus courante, le terme parunTest métrique est le plus souvent utilisé pour signifier un test qui assume données normalement distribuées.

Mais parfois, vos données ne sont pas paramétrique. Par exemple, vous voudrez peut-être de ne pas présumer que vos données est normalement distribué, car il peut être très sensiblement biaisée, comme indiqué dans la partie A de la figure.

image0.jpg


Parfois, vous pourriez être en mesure d'effectuer une sorte de transformation de vos données, il a distribué plus normalement. Par exemple, de nombreuses variables qui ont une distribution asymétrique peuvent être transformés en numéros normalement distribuée en tenant logarithmes, comme illustré dans la partie b. Si, par essais et erreurs, vous pouvez trouver une sorte de transformation qui normalise vos données, vous pouvez exécuter les tests classiques sur les données transformées.

Mais parfois, vos données sont obstinément anormale, et vous ne pouvez pas utiliser les tests paramétriques. Heureusement, les statisticiens ont développé des tests spéciaux qui ne supposent pas de données distribuées normalement ceux-ci sont (sans surprise) appelés tests non paramétriques. La plupart des tests paramétriques classiques communes ont homologues non paramétriques.

Comme vous pouvez vous attendre, les tests les plus largement connues et couramment utilisés non paramétriques sont celles qui correspondent à des tests les plus connues et couramment utilisées classiques.

Les contreparties non paramétriques de tests classiques
Classique test paramétriqueEquivalent non paramétrique
Un groupe ou jumelé test t de StudentInscrivez-Test-Wilcoxon-rangs essai
Deux-groupe test t de StudentTest-test de Mann-Whitney Wilcoxon somme des rangs
L'analyse de varianceTest de Kruskal-Wallis
Test de corrélation de PearsonSpearman Rang test de corrélation

La plupart des tests non paramétriques impliquent premier tri de vos valeurs de données, du plus bas au plus haut, et l'enregistrement du rang de chaque mesure (la valeur la plus faible a un rang de 1, la prochaine valeur la plus élevée d'un rang de 2, et ainsi de suite). Tous les calculs subséquents sont effectués avec ces rangs plutôt que par les valeurs de données réelles.

Bien que des tests non paramétriques ne supposent pas la normalité, ils ne font certaines hypothèses à propos de vos données. Par exemple, de nombreux tests non paramétriques supposer que vous ne disposez pas de toutes les valeurs liées à votre ensemble de données (en d'autres termes, pas de deux sujets ont exactement les mêmes valeurs). La plupart des tests paramétriques incorporent des ajustements pour la présence de liens, mais cela affaiblit l'épreuve et rend les résultats non exacte.

Même dans les statistiques descriptives, les paramètres communs ont homologues non paramétriques. Bien que les moyens et les écarts-types peuvent être calculés pour une série de chiffres, ils sont les plus utiles pour résumer les données lorsque les numéros sont normalement distribués. Lorsque vous ne savez pas comment les numéros sont distribués, les médianes et les quartiles sont beaucoup plus utiles que les mesures de tendance centrale et de dispersion.


» » » » Allez dehors de la norme avec les statistiques non paramétriques