📊

Notes sur les tests statistiques en pratique

Jun 24, 2024

Tests statistiques en pratique

Nullité d'un coefficient de corrélation

  • Le test de nullité de corrélation n'a pas de nom spécifique comme le test du chi2 ou le test t de Student.
  • Conditions de validité :
    • Une des deux variables doit suivre une loi normale.
    • Il n'est pas nécessaire que les deux variables suivent une loi normale.

Exemple d'étude : Santé mentale en prison

  • Hypothèse : Avec l'âge, les individus recherchent de moins en moins des sensations fortes.
  • Utilisation de la fonction cor.test() en R pour tester la corrélation entre l'âge et la recherche de sensation.
  • Syntaxe : cor.test(variable1, variable2).
  • Résultats :
    • p-value extrêmement faible (< 10^-8), indiquant une corrélation significativement non nulle.
    • Coefficient de corrélation : -0,22, confirmant une corrélation négative entre l'âge et la recherche de sensation.
    • Intervalle de confiance : Entre -0,29 et -0,15.

Distribution des variables

  • Distribution de l'âge des détenus approximativement normale.
  • Variable de recherche de sensation codée en 1, 2, 3 (1 : faible, 2 : moyen, 3 : élevé).
  • Importance de la normalité pour utiliser le test classique de nullité du coefficient de corrélation de Pearson.

Test alternatif : Corrélation de Spearman

  • Utilisation si les conditions de validité ne sont pas respectées pour Pearson.
  • Basé sur les rangs des sujets plutôt que sur les observations elles-mêmes.
  • Plus robuste que Pearson.
  • Fonction R : cor.test(..., method="spearman").
  • Résultats similaires : p-value très faible (~ 10^-9), coefficient de corrélation rho ≈ -0,22.
  • Avantages et inconvénients :
    • Moins puissant que Pearson.
    • Problème des ex-aequo, notamment s'il y a peu de niveaux de variation.
    • Si vous utilisez Spearman, vous considérez que les variables ne suivent pas de loi normale, ce qui limite l'utilisation de certaines techniques comme la régression linéaire multiple.

Tests statistiques moins fréquents mais utiles

Comparaison d'une moyenne à une moyenne de référence

  • Situation où l'on connait la valeur de référence d'un paramètre (ex : QI moyen = 100).
  • Fonction R : t.test(variable, mu=valeur_de_référence).

Tests appariés

  • Utilisés pour des mesures avant et après sur le même groupe de sujets.
  • Pour des variables qualitatives : Test de MacNemar (mcnemar.test(avant, après)).
  • Pour des variables quantitatives :
    • Test de Student pour populations appariées (t.test(avant, après, paired=TRUE)).
    • Nécessaire pour éviter une sous-estimation de la puissance de l'expérience.

Conclusion

  • En statistiques, le choix du test dépend des conditions de validité et de l'interprétation que l'on souhaite donner aux résultats.
  • Il est crucial de comprendre les avantages et limites de chaque test pour une analyse précise et fiable.