Notes sur les tests statistiques en pratique

Terminons cette série de chapitres sur les tests statistiques en pratique par la question de nullité d&#39;un coefficient de corrélation et plusieurs autres points plus accessoires. Le test de nullité de corrélation n&#39;a pas de nom extraordinaire comme le test du chi2 ou le test t de student. Les conditions de validité de ce test sont assez simples. Si vous voulez tester la nullité de corrélation de la variable x avec la variable y, il faut que la distribution de x ou la distribution de y suive une loi normale. Il est donc pas nécessaire que les deux variables suivent une loi normale. Mais seulement l&#39;une des deux. Rentrons tout de suite dans le vif du sujet. Dans l&#39;étude santé mentale en prison, Nous allons étudier la corrélation qui est susceptible d&#39;avoir entre un âge élevé et un niveau de recherch de sensation faible. En effet, nous faisons l&#39;hypothèse que avec l&#39;âge les individus recherchent de moins en mois des sensations fortes. Nous allons donc tester à 0 cette corrélation et la fonction R correspondante est la fonction cor.test(). Sa syntaxe est élémentaire. On met d&#39;abord la première variable et ensuite la seconde. Les résultats sont classiques. On a d&#39;abord le petit p qui est ici extrèmement faible inférieur à 10-8 . La corrélation est donc très significativement non nulle. La fonction cor.test() donne bien évidemment également le résultat de la corrélation ici moins 0,22. Ça confirme notre hypothèse. Il y a bien une corrlation négative entre age et recherche de sensation. Enfin, la fonction cor.test() donne également un intervalle de confiance de ce coefficient de corrélation. Que signifie-t-il ? Il signifie que la corrélation de (-0,22) que l&#39;on a observée et celle que l&#39;on a observée dans l&#39;échantillon des 799 détenus. Comme d&#39;habitude, on peut s&#39;interroger : Quelle est la valeur possible de la corrélation entre age et recherche de sensation, non pas dans cet échatillon mais dans l&#39;ensemble de la population des détenus ? Eh bien, il y 95 chances sur 100 que cette corrélation soit comprise entre -0,29 et -0,15. Nous avons vu dans les chapitres précédents que la distribution de l&#39;âge des détenus était approximativement normale, très approximativement à vrai dire puisque la distribution était franchement asymétrique. Mais disons qu&#39;en première approximation, la normalité est suffisante pour accepter d&#39;utiliser le test classique de nullité du coefficient de corrélation de Pearson. C&#39;est d&#39;autant plus que la variable, ici, la variable recherche de sensation n&#39;est pas du tout normale puisqu&#39;elle est codée en 1, 2, 3. 1 pour recherche de sensation faible, 2 pour moyen, 3 pour élevé. Donc, il fallait absolument que l&#39;âge suive une loi normale. Si vous êtes embêté par ces conditions de validité, alors il faut recourir à une autre technique. Et cette autre technique existe. Il s&#39;agit du test de nullité du coefficient de corrélation de Spearman et puis de Pearson. La corrélation de Spearman porte sur les rangs des sujets et plus sur les observations elles-mêmes. Vous prenez les âges des sujets et vous classez ces âges du plus petit au plus grand, vous prenez les recherches de sentation et vous les classez des plus petites au plus grandes et vous la corrélation des rangs de l&#39;âge avec les rangs de la recherche de sensation. Vous avez ici, une méthode qui est beaucoup plus robuste. La fonction R qui permet de tester la corrélation de Spearman, c&#39;est la même fonction, c&#39;est cor.test(). Il suffit de rajouter method=&quot;spearman&quot;». Nous avons ici les résultats avec un p toujours extrèmement faible autour de 10-9 et une corrélation qui est appelée ici rho très proche de celle que avions avant puisqu&#39;elle vaut moins 0,22. Alors à ce stade, on peut se demander, pourquoi ne pas tester systématiquement la corrélation de Spearman plutôt que la corrélation de Pearson puisque pour Pearson, il faut la normalité d&#39;une des deux variables , alors que pour Spearman, il n&#39;y a aucune condition de validité. Alors, certes, le test de nullité de corrélation de Spearman est un tout petit moins puissant. Mais ça n&#39;est pas bien méchant. Nous avons aussi un autre inconvénient qui est indiqué d&#39;ailleurs sur les résultats de R, c&#39;est que les corrélations de Spearman sont gênées par les ex-aequo. Or ici, il y beaucoup d&#39;ex-aequo puisqu&#39;il n&#39;y a que 3 niveaux de recherche de sensation 1, 2, 3. Et, c&#39;est une limite assez sérieuse à l&#39;utilisation de la méthode. Enfin de la même façon que dans le test, qu&#39;il vaut mieux réserver le test de Wilcoxon à des situations où on n&#39;a vraiment pas la normalité de la variable comme on l&#39;a vu dans le chapitre précédent. C&#39;est même chose ici. Si vous utilisez une corrélation de Spearman, c&#39;est que de facto, vous considérez ni x, ni y, ni l&#39;âge, ni la recherche de sensation ne suivent des lois normales. Et, de fait, ça va vous interdire d&#39;utiliser ensuite toute technique statistique qui nécessite la normalité de ces variables, en particulier une régression linéaire multiple. Donc, avant de vous interdire toutes ces méthodes, il faut vraiment peser le pour et le contre et se demander si l&#39;âge oui ou non suit suffisamment une loi normale pour se lancer dans une corrélation de Pearson plutôt qu&#39;une corrélation de Spearman. Pour terminer, intéressons-nous à des test statistiques beaucoup moins fréquents mais qui sont quand même utiles et qu&#39;il faut connaître parce qu&#39;elles peuvent tirer d&#39;affaire dans des situations un peu délicates. La première de ces situations concerne la comparaison d&#39;une moyenne à une moyenne de référence. En général, on ne connait pas la valeur de référence d&#39;un paramètre dans une population. Mais il y a des situations où c&#39;est le cas, par exemple le QI. Pour un âge donné, on sait que la moyenne du QI vaut 100. Ainsi, si vous avez un groupe de patients hyperactifs, si vous vous demandez si la moyenne de leur QI est conforme à la moyenne du QI de la population de référence. Eh bien, c&#39;est facile, il suffit de comparer le QI de vos patients à 100. La syntaxe R a recours à la même fonction t.test(). Mais, là, nous aurons comme syntaxe que la variable QI , ici nous avons pris age comme exemple, et puis à côté, on met la valeur de référence mu=24 pour l&#39;âge, ça serait 100 si c&#39;était le QI. Un deuxième cas qui n&#39;est pas si rare concerne les tests dits « appariés » . La plupart des situations où on a recours à des tests appariés sont des situations où on a des mesures avant et après. C&#39;est-à-dire on suit un groupe de sujets et on suit son évolution en cours du temps. Alors, le cas le moins fréquent concerne les variables qualitatives, par exemple, vous pouvez vous demander si un an avant le mariage, les hommes font plus ou moins de sport que, un an après leur mariage. Pour répondre à cette question, vous allez suivre un groupe d&#39;hommes et puis vous allez comparer le pourcentage de sportifs avant le mariage au pourcentage de sportifs après le mariage. Là, on serait tenter de faire un teste du chi2 ! Mais, le test du chi2 ne va tenir compte du fait que ce sont les mêmes hommes qu&#39;il y a avant et après. Donc, le résultat ne va pas être complètement faux, mais ne va tenir compte du fait que chaque sujet est son propre contrôle. Vous sous-estimerez considérablement la puissance de votre expérience à utiliser un test du chi2, et donc il ne faut pas le faire. Le test qu&#39;il faut utiliser s&#39;appelle le test MacNemar. La fonction R correspondante est mcnemar.test() et sa syntaxe est très simple. Vous utiserez la variable « avant » puis la variable « après » et le résultat est un petit p comme d&#39;habitude. Beaucoup plus fréquent, c&#39;est des tests appariés sur des variables quantitatives. En effet, vous pouvez suivre le QI d&#39;enfants avant et après une technique de rééducation. Vous pouvez comparer les revenus d&#39;individus à 30 ans et à 40 ans. Dans ces cas-là, de la même façon pour le test de McNemar, si vous utilisez un test de Student classique, vous n&#39;allez pas tenir compte du fait que c&#39;est la même population qu&#39;il y a avant et après et vous serez en situation de sous-puissance. Il faut donc utiliser un test de Student dit aux populations appariées. La fonction R est toujours t.test(). Vous mettrez dans ce cas-là comme syntaxe la variable avant suivie de la variable après suivie de l&#39;instruction paired=TRUE. Vous n&#39;avez que deux instructions à tester par vous-mêmes pour ce chapitre. En effet, avec notre fichier santé mentale en prison, en particulier nous n&#39;avons pas la possibilité de pouvoir utiliser des tests appariés puisque nous n&#39;avons qu&#39;un seul temps de mesure.

Terminons cette série de chapitres sur les
tests statistiques en pratique par la question de nullité d&amp;#39;un coefficient de corrélation
et plusieurs autres points plus accessoires. Le test de nullité de corrélation n&amp;#39;a pas
de nom extraordinaire comme le test du chi2 ou le test t de student. Les conditions de
validité de ce test sont assez simples. Si vous voulez tester la nullité de corrélation
de la variable x avec la variable y, il faut que la distribution de x ou la distribution
de y suive une loi normale. Il est donc pas nécessaire que les deux variables suivent
une loi normale. Mais seulement l&amp;#39;une des deux. Rentrons tout de suite dans le vif du
sujet. Dans l&amp;#39;étude santé mentale en prison, Nous
allons étudier la corrélation qui est susceptible d&amp;#39;avoir entre un âge élevé et un niveau
de recherch de sensation faible. En effet, nous faisons l&amp;#39;hypothèse que avec
l&amp;#39;âge les individus recherchent de moins en mois des sensations fortes. Nous allons
donc tester à 0 cette corrélation et la fonction R correspondante est la fonction
cor.test(). Sa syntaxe est élémentaire. On met d&amp;#39;abord la première variable et ensuite
la seconde. Les résultats sont classiques. On a d&amp;#39;abord le petit p qui est ici extrèmement
faible inférieur à 10-8 . La corrélation est donc très significativement non nulle.
La fonction cor.test() donne bien évidemment également le résultat de la corrélation
ici moins 0,22. Ça confirme notre hypothèse. Il y a bien une corrlation négative entre
age et recherche de sensation. Enfin, la fonction cor.test() donne également un intervalle
de confiance de ce coefficient de corrélation. Que signifie-t-il ? Il signifie que la corrélation
de (-0,22) que l&amp;#39;on a observée et celle que l&amp;#39;on a observée dans l&amp;#39;échantillon des 799
détenus. Comme d&amp;#39;habitude, on peut s&amp;#39;interroger : Quelle est la valeur possible de la corrélation
entre age et recherche de sensation, non pas dans cet échatillon mais dans l&amp;#39;ensemble
de la population des détenus ? Eh bien, il y 95 chances sur 100 que cette corrélation
soit comprise entre -0,29 et -0,15. Nous avons vu dans les chapitres précédents
que la distribution de l&amp;#39;âge des détenus était approximativement normale, très approximativement
à vrai dire puisque la distribution était franchement asymétrique. Mais disons qu&amp;#39;en
première approximation, la normalité est suffisante pour accepter d&amp;#39;utiliser le test
classique de nullité du coefficient de corrélation de Pearson. C&amp;#39;est d&amp;#39;autant plus que la variable,
ici, la variable recherche de sensation n&amp;#39;est pas du tout normale puisqu&amp;#39;elle est codée
en 1, 2, 3. 1 pour recherche de sensation faible, 2 pour moyen, 3 pour élevé. Donc,
il fallait absolument que l&amp;#39;âge suive une loi normale. Si vous êtes embêté par ces
conditions de validité, alors il faut recourir à une autre technique.
Et cette autre technique existe. Il s&amp;#39;agit du test de nullité du coefficient de corrélation
de Spearman et puis de Pearson. La corrélation de Spearman porte sur les rangs des sujets
et plus sur les observations elles-mêmes. Vous prenez les âges des sujets et vous classez
ces âges du plus petit au plus grand, vous prenez les recherches de sentation et vous
les classez des plus petites au plus grandes et vous la corrélation des rangs de l&amp;#39;âge
avec les rangs de la recherche de sensation. Vous avez ici, une méthode qui est beaucoup
plus robuste. La fonction R qui permet de tester la corrélation de Spearman, c&amp;#39;est
la même fonction, c&amp;#39;est cor.test(). Il suffit de rajouter method=&amp;quot;spearman&amp;quot;». Nous avons
ici les résultats avec un p toujours extrèmement faible autour de 10-9 et une corrélation
qui est appelée ici rho très proche de celle que avions avant puisqu&amp;#39;elle vaut moins 0,22.
Alors à ce stade, on peut se demander, pourquoi ne pas tester systématiquement la corrélation
de Spearman plutôt que la corrélation de Pearson puisque pour Pearson, il faut la normalité
d&amp;#39;une des deux variables , alors que pour Spearman, il n&amp;#39;y a aucune condition de validité.
Alors, certes, le test de nullité de corrélation de Spearman est un tout petit moins puissant.
Mais ça n&amp;#39;est pas bien méchant. Nous avons aussi un autre inconvénient qui est indiqué
d&amp;#39;ailleurs sur les résultats de R, c&amp;#39;est que les corrélations de Spearman sont gênées
par les ex-aequo. Or ici, il y beaucoup d&amp;#39;ex-aequo puisqu&amp;#39;il n&amp;#39;y a que 3 niveaux de recherche
de sensation 1, 2, 3. Et, c&amp;#39;est une limite assez sérieuse à l&amp;#39;utilisation de la méthode.
Enfin de la même façon que dans le test, qu&amp;#39;il vaut mieux réserver le test de Wilcoxon
à des situations où on n&amp;#39;a vraiment pas la normalité de la variable comme on l&amp;#39;a
vu dans le chapitre précédent. C&amp;#39;est même chose ici. Si vous utilisez une corrélation
de Spearman, c&amp;#39;est que de facto, vous considérez ni x, ni y, ni l&amp;#39;âge, ni la recherche de
sensation ne suivent des lois normales. Et, de fait, ça va vous interdire d&amp;#39;utiliser
ensuite toute technique statistique qui nécessite la normalité de ces variables, en particulier
une régression linéaire multiple. Donc, avant de vous interdire toutes ces méthodes,
il faut vraiment peser le pour et le contre et se demander si l&amp;#39;âge oui ou non suit suffisamment
une loi normale pour se lancer dans une corrélation de Pearson plutôt qu&amp;#39;une corrélation de
Spearman. Pour terminer, intéressons-nous à des test
statistiques beaucoup moins fréquents mais qui sont quand même utiles et qu&amp;#39;il faut
connaître parce qu&amp;#39;elles peuvent tirer d&amp;#39;affaire dans des situations un peu délicates.
La première de ces situations concerne la comparaison d&amp;#39;une moyenne à une moyenne de
référence. En général, on ne connait pas la valeur
de référence d&amp;#39;un paramètre dans une population. Mais il y a des situations où c&amp;#39;est le cas,
par exemple le QI. Pour un âge donné, on sait que la moyenne du QI vaut 100.
Ainsi, si vous avez un groupe de patients hyperactifs, si vous vous demandez si la moyenne
de leur QI est conforme à la moyenne du QI de la population de référence. Eh bien,
c&amp;#39;est facile, il suffit de comparer le QI de vos patients à 100. La syntaxe R a recours
à la même fonction t.test(). Mais, là, nous aurons comme syntaxe que la
variable QI , ici nous avons pris age comme exemple, et puis à côté, on met la valeur
de référence mu=24 pour l&amp;#39;âge, ça serait 100 si c&amp;#39;était le QI. Un deuxième cas qui
n&amp;#39;est pas si rare concerne les tests dits « appariés » . La plupart des situations
où on a recours à des tests appariés sont des situations où on a des mesures avant
et après. C&amp;#39;est-à-dire on suit un groupe de sujets et on suit son évolution en cours
du temps. Alors, le cas le moins fréquent concerne les variables qualitatives, par exemple,
vous pouvez vous demander si un an avant le mariage, les hommes font plus ou moins de
sport que, un an après leur mariage. Pour répondre à cette question, vous allez suivre
un groupe d&amp;#39;hommes et puis vous allez comparer le pourcentage de sportifs avant le mariage
au pourcentage de sportifs après le mariage. Là, on serait tenter de faire un teste du
chi2 ! Mais, le test du chi2 ne va tenir compte du fait que ce sont les mêmes hommes qu&amp;#39;il
y a avant et après. Donc, le résultat ne va pas être complètement faux, mais ne va
tenir compte du fait que chaque sujet est son propre contrôle. Vous sous-estimerez
considérablement la puissance de votre expérience à utiliser un test du chi2, et donc il ne
faut pas le faire. Le test qu&amp;#39;il faut utiliser s&amp;#39;appelle le test MacNemar. La fonction R
correspondante est mcnemar.test() et sa syntaxe est très simple. Vous utiserez la variable
« avant » puis la variable « après » et le résultat est un petit p comme d&amp;#39;habitude.
Beaucoup plus fréquent, c&amp;#39;est des tests appariés sur des variables quantitatives. En effet,
vous pouvez suivre le QI d&amp;#39;enfants avant et après une technique de rééducation. Vous
pouvez comparer les revenus d&amp;#39;individus à 30 ans et à 40 ans. Dans ces cas-là, de
la même façon pour le test de McNemar, si vous utilisez un test de Student classique,
vous n&amp;#39;allez pas tenir compte du fait que c&amp;#39;est la même population qu&amp;#39;il y a avant
et après et vous serez en situation de sous-puissance. Il faut donc utiliser un test de Student dit
aux populations appariées. La fonction R est toujours t.test(). Vous mettrez dans ce
cas-là comme syntaxe la variable avant suivie de la variable après suivie de l&amp;#39;instruction
paired=TRUE. Vous n&amp;#39;avez que deux instructions à tester
par vous-mêmes pour ce chapitre. En effet, avec notre fichier santé mentale en prison,
en particulier nous n&amp;#39;avons pas la possibilité de pouvoir utiliser des tests appariés puisque
nous n&amp;#39;avons qu&amp;#39;un seul temps de mesure.

Transcript for:Notes sur les tests statistiques en pratique

Transcript for:
Notes sur les tests statistiques en pratique