Transcript for:
Guide sur les ANOVA à Mesures Répétées

non bonjour à tous dans les quelques vidéos qui vont suivre nous allons parler des anneaux va à mesures répétées vous connaissez déjà les anneaux va analyse de variance et vous savez que ce sont des tests qu'on va appliquer lorsqu'on aura une ou plusieurs variables indépendantes de type catégorielles et une variable dépendante de type ce qu'ils on parle d'un nova à mesure répéter lorsque plusieurs mesures sont effectuées sur les mêmes individus statistiques un individu statistiques ça peut être soit un sujet soit un groupe de sujets qui entretiennent des relations de dépendance entre par exemple si j'ai envie d'étudier la satisfaction conjugale de couple eh bien je considérer que chaque couple constitue un individu statistiques et ce même s'il est constitué de deux personnes physiques distinctes pourquoi est-ce que je les traite toutes les deux comme un seul et même individu statistiques et bien parce qu'il ya un fort lien de dépendance entre la mesure qui sera prise sur chacun de ses membres si une des deux personnes du couple est très satisfaite au sein de son couple il y a très peu de chances pour que l'autre ne le soit pas du tout est l inverse si un des deux membres n'est absolument pas satisfait au sein de son couple il y a très peu de chances pour que l'autre soit très satisfait et même si on observe des différences entre les scores des deux membres au sein du couple il y a vraisemblablement toute une série d'éléments qui va entraîner un lien de dépendance entre leurs deux corps puisque ce sont les personnes qui a priori vivent au même endroit partage pas mal d'expérience de vie commune et cetera in fine et on repérera des mesures répétées dans deux situations distinctes et la première est celle où des individus statistiques sont mesurés dans plusieurs modalités d'un facteur ou de plusieurs facteurs de type intra l'exemple classique est celui du facteur avant après imaginons qu'on se demande si un certain entraînement spécifique pour améliorer les performances en mathématiques d'un ensemble d'enfants et bien pour le prouver on pourra mesurer le score de performance avant et après l'entraînement spécifique et ce dans le but de voir s'il y a eu une évolution la deuxième situation est celle où on collectera plusieurs mesures répétées sur un seul et même individu statistiques sans pour autant que ces différentes mesures ne se rapportent à des modalités distinctes d'un facteur intra l'exemple que je donnais précédemment sur la mesure de satisfaction au sein de couples est un tel exemple on distinguera trois types de design différent lorsqu'on fera des anneaux va à mesures répétées et tout l'objectif de cette première vidéo sera de vous amener à comprendre comment faire la différence entre les plans ni chez les plans croisés et les plans mixte vous verrez que pour déterminer en présence de quel type de design on se trouve on va toujours procéder de la même manière dans un premier temps comme vous avez d'ailleurs l'habitude de le faire pour repérer le test adéquat pour tester n'importe quel type d'hypothèses on va commencer par identifier la ou les vih dans le design ainsi que la variable dépendante et on va se demander de quelle nature sont chacune de ces variables par nature je veux dire est ce qu'il s'agit de variables catégorielles ou de variable quantitatives comme vous le savez déjà si vous repérez une ou plusieurs variables indépendantes catégorielles ainsi qu'une variable dépendante de type scale quantitative vous savez que voudrait faire une à nova une fois qu'on a repéré et qu'on est en présence d'une hypothèse qu'on pourra tester à travers une à nova on va essayer d'identifier l'individu statistiques et surtout tenter de déterminer combien est-ce qu'il ya deux mesures par individu statistiques comme vous l'aurez compris si il y a plusieurs mesures par individu statistiques on devra faire une à nova à mesures répétées ensuite on va essayer de positionner les mesures répétées par rapport aux modalités des différentes variables indépendantes et c'est cette étape qui va nous amener à faire la différence entre les plans ni chez les plans croisés et les plans mixte comme j'y reviendrai dans quelques instants avec plus de détails une fois qu'on aura identifié quel type de design on voulait étudier et bien il faudra vous posez des questions classiques que vous avez l'habitude de vous poser est ce que j'ai une idée à l'avance de l'endroit de la différence ou au contraire est-ce que je souhaite partir sur une logique de comparaison 2 à 2 et enfin est-ce que je vais définir des hypothèses unis ou bilatérales mais cette dernière question on ne se la pose rappaz dans cette vidéo si puisque notre objectif est d'arriver à déterminer en présence de quel type de plan on se trouve et donc on s'arrêtera à la troisième question la suite sera traité dans une prochaine vie guéri partons tout de suite d'un exemple imaginons qu'on s'intéresse à trois groupes d' équipe de joueurs de tennis en double qui ont été soumis respectivement en plus de la préparation physique et des techniques habituelles soit à une préparation vise à renforcer la confiance en soi à une préparation visant à lutter contre le stress ou à aucune préparation supplémentaire du tout pour chaque joueur on va calculer un an de performance et on s'attend à observer de meilleures performances moyennes pour les joueurs qui ont reçu une préparation spécifique que ce soit gestion de la confiance en soi ou du stress par rapport à ceux qui n'ont pas suivi d'entraînement spécifique du tout comme nous l'avons déjà vu la première étape sera d'identifier la ou les pays ainsi que la bd est de déterminer leur nature pour pouvoir repérer la veillée la bd il faut commencer par repérer l'hypothèse or la voici on s'attend à observer de meilleures performances pour les joueurs ayant reçu une préparation spécifique sans qu'il n'y ait de différence significative les performances moyennes en fonction de la préparation reçu dans cette hypothèse vous devez repéré que les performances devraient varier suivant la condition dans laquelle on se trouve est ce qu'on a reçu un entraînement spécifique confiance en soi gestion du stress ou aucun entraînement autrement dit la variable dépendante et le score de performance dans la mesure où en calcul un indice on se doute que ce sera une variable de type quantitatif et enfin comme je l'aï déjà dit également le score de performance va varier en fonction de la condition dans laquelle on se trouve la condition la préparation spécifique reçu sera donc la variable indépendante et comme on peut le voir ici il s'agit d'une variable indépendante catégorielles à trois modalités voilà qui vous amène à comprendre qu'on devrait réaliser une à nova à un facteur puisqu'on est variable indépendante catégorielles à trois modalités ainsi qu'une variable dépendante de type ski la deuxième question à se poser c'est qu'est-ce que l'individu statistiques dans mon design et surtout combien est ce que j'ai répété de mesures par individu statistiques comme vous le savez comme on l'a déjà vu il y a deux situations qui peuvent amener à la présence de mesures répétées et la première situation était la présence d'un facteur de type intra le seul facteur dans mon design nous l'avons déjà vu c'est le type de préparation spécifique qui a été réalisé en plus de la préparation physique et des techniques habituelles on avait vu qu'on avait une variable indépendante catégorielles à trois modalités pour déterminer s'il s'agit d'un facteur de type intra ou d'un facteur de type inter il faut se demander est ce que ce sont les mêmes individus statistiques qui sont testés trois fois dans chacune des conditions où est-ce qu'on a trois groupes de sujets distincts qui sont répartis dans une des trois conditions et la réponse vous l'avez ici on a trois groupes d' équipe de joueurs qui ont été soumis respectivement à chacun des entraînements qui sont proposés on a bien dit respectivement et non successivement ce ne sont donc pas les mêmes équipes de joueurs qui se retrouvent dans chacune des modalités de la variable indépendante voilà qui nous amène à comprendre que notre facteur est un facteur de type inter et donc on ne va pas avoir de mesures répétées qui définiront un facteur de type intra il y a par contre bien des mesures répétées parce qu'on étudie non pas des joueurs solitaires mais des équipes de joueurs autrement dit un individu statistiques ce ne sera pas un joueur mais une équipe de joueurs dans la mesure où il y a deux personnes physiques par équipes on aura bien nécessairement au moins deux mesures répétées par individu statistiques quand vous aurez une vue d'ensemble sur les différents types de plans qu'on peut avoir lorsqu'on fait de ne jamais se répéter vous serez en mesure de comprendre que là je vous ai déjà donné suffisamment d'éléments pour déterminer qu'on sera une à nova à un facteur avec plan nicher mais afin de m'assurer que vous compreniez bien ce qui m'amène à déterminer ce type de plan et surtout pour vous donner une stratégie que vous pourrez appliquer pour n'importe quel type dha nova mesures répétées nous allons faire un petit exercice qu'on fera dans chaque exemple qui consiste à repérer les différents individus statistiques dans la base de données à déterminer combien est-ce qu'il ya deux mesures répétées par individu statistiques et surtout à positionner ces mesures répétées par rapport aux modalités du ou des facteurs qui nous intéresse dans le design cela constitue donc la troisième étape lorsqu'on décortique un scénario et qu'on a pris conscience du fait qu'on devra faire une à nova à mesures répétées dans notre exemple on s'intéresse à 30 équipes de joueurs il y a dix équipes de joueurs qui se trouvent dans la condition sans entraînement supplémentaire il y a dix équipes qui se trouvent dans la condition gestion de la confiance en soi et enfin il y a dix équipes qui se trouvent dans la condition gestion du stress vous voyez donc bien qu'il y a trente équipes en tout soit 30 individus statistiques je vais mettre en évidence un seul des individus statistiques juste pour illustration mais j'aurais pu faire exactement la même chose en prenant n'importe quelle autre équipe de la base de données ça n'aurait rien changé du tout le but du jeu est de se demander d'abord combien ce qu'il ya de mesures répétées dans cet individu statistiques que j'ai mis en est danse vous voyez 52 et 54 j'ai deux mesures répétées soit un indice de performance pour chacun des joueurs de l'équipe je vais ensuite me demander est ce que ces deux mesures répétées sont répartis entre toutes les modalités du facteur ou est-ce qu'au contraire elles sont toutes dans une seule et unique modalités du facteur ici je constate que les deux mesures se rapporte à une et une seule modalité du facteur qui est la condition aucune préparation supplémentaire je dirais donc que les mesures répétées sont nichés à l'intérieur d'une des modalités du facteur de mon design et c'est ce qui m'amène à comprendre que ici je vais faire une à nova a mesuré péter pleurnicher partant d'un deuxième exemple où cette fois 10 sujets ont été soumis à une épreuve de reconnaissance de chypre chaque sujet se voit présenter une série de dix chiffres et on en demande ensuite de les restituer de mémoire pour chaque sujet l'expérience réalisés successivement dans les conditions qui vont différer en fonction du temps de présentation de la série de chiffres dix vingt ou trente secondes et du type de séries qui est présentée soit aléatoire soit ordonnée de manière croissante on va s'attendre à ce que le nombre de chiffres reconnus par chaque sujet soit plus grand pour les séries ordonné que pour les séries aidé at war et que cette différence voit s'estomper lorsque le temps de présentation va augmenter on s'attend également à une augmentation du nombre de restitution correct avec le temps et ce pour les deux types de séries commençons par repérer l'hypothèse ou plus spécifiquement les hypothèses puisque envers haïti qu'il y en a plusieurs et les voici on s'attend à ce que le nombre de chiffres reconnus varient suivant qu'on présente des séries ordonné aux des séries aléatoire pour commencer plus tard on dira qu'on s'attend également à ce que le nombre de chiffres reconnus varie en fonction du temps de présentation quoi qu'il en soit la variable qui est censé varier en fonction de la condition dans laquelle on se trouve c'est le nombre de chiffres reconnus le nombre de chiffres reconnus constituera donc la variable dépendante dans mon design et puisqu'il s'agit d'un nombre il s'agit forcément d'une variable de type quantitatif le nombre de chiffres reconnus peut varier en fonction de deux facteurs d'abord en fonction du type de zeri est ce qu'il s'agit d'une série aléatoire ou ordonner cela constitue donc une première variable indépendante qui est de type catégorielles et à deux modalités aléatoire vs port donné le nombre de chiffres reconnus devrait varie également en fonction d'un autre facteur qui ait le temps de présentation qui est un facteur à trois modalités donc une variable indépendante qualitative à trois modalités 10 vs 22 h 30 secondes on pourrait envisager de faire une à nova à deux facteurs puisqu'on a deux variables indépendantes catégorielles et une bd ce qu'il attention n'oubliez surtout pas un détail très important ce que si on veut envisager plusieurs facteurs en même temps dans un seul et même design il faut qu'on ait des bonnes raisons d'envisager qu'il y ait une interaction entre ces différents facteurs une interaction c'est le fait que l'effet d'un facteur ne sera pas le même en fonction de la modalité de l'autre facteur dans laquelle on se trouve on signale qu'on s'attend à ce que le nombre de chiffres reconnus soit plus grand pour les séries ordonné qu'aléatoire autrement dit on s'attend à ce qu'il y ait une différence entre le nombre de chiffres restituer pour les différentes modalités du facteur type de série mais on s'attend également à ce que la différence entre ces deux modalités cesse-t-on lorsque le temps de présentation augmentent cette indication m'amène à comprendre que l'effet du type de série ne sera pas le même suivant qu'on présente les séries pendant dix vingt ou trente secondes il ya donc bien une interaction suspecté entre les deux facteurs et donc je peut en déduire qu effectivement une à nova à deux facteurs sera un test adéquat pour tester l'ensemble des hypothèses envisagées ici à présent nous allons devoir identifier les individus statistiques et se demander combien est-ce qu'il ya deux mesures répétées par individu statistiques contrairement aux premiers exemples l'individu est bien une personne physique puisque on explique bien que notre échantillon c'est un ensemble de dix sujets par contre chacune de ces personnes physiques ne sera pas testé une seule fois mais plusieurs fois ce qu'on voit au fait qu'il est indiqué que chaque sujet sera testée successivement dans les conditions ci en à cette indication là on comprend que chaque individu sera testée d'abord dans la première condition ensuite dans la deuxième et cetera pour toutes les conditions dans la mesure où ce sont les mêmes individus statistiques qui sont testés dans toutes les modalités du facteur temps de présentation on comprend que ce facteur est un facteur de type intra et de la même manière dans la mesure où tous les individus statistiques sont testés successivement dans toutes les conditions du facteur type de série donc chaque individu sera d'abord testé avec des séries aléatoire et ensuite avec des séries ordonnée on comprend que le type de série est également un facteur de type peintres comme précédemment nous allons repérer les différents individus statistiques dans notre base de données et surtout on va se demander combien est-ce qu'il ya deux mesures répétées par l'individu statistiques ensuite on positionnera ces mesures répétées par rapport à chacun des facteurs de notre design on fera l'exercice par rapport à chaque facteur séparément dans un premier temps on va tenter de positionner les mesures répétées par rapport aux modalités du facteur types de séries aléatoire vie désordonnée et ensuite on refera le même exercice en positionnant les mesures répétées par rapport aux modalités du facteur temps à trois modalités 10 20 et 30 ce il y a dix individus statistiques puisque 10 sujets dans notre base de données et chaque individu statistique a été testé dans six conditions distinctes lorsqu'on lui présentait des séries aléatoire avec un temps de présentation de dix secondes lorsqu'on lui présentait des céréales et à thouars avec un temps de présentation de 20 secondes et cetera pour les six conditions qui sont en fait défini par tous les croisements possibles de modalités entre nous deux facteurs dans la mesure où on a un design 2 x 3 il est normal qu'il y ait si croisement de modalités possibles je veux mettre en évidence le premier individu statistiques mais comme précédemment j'aurais pu faire l'exercice que je vais faire maintenant sur n'importe quel individu statistiques n'aurait rien changé l'objectif sera de positionner les mesures répétées par rapport à chaque facteur dit autrement je vais me demander est ce que c'est si mesures répétées sont dans une et une seule modalité du facteur qui m'intéresse ou est-ce qu'au contraire elles sont répartis entre toutes les modalités de ce facteur si je commence à fin d'exercice en m'intéressant aux facteurs types de séries aléatoire vs ordonnée je constate que trois des six mesures sont dans la condition aléatoire et que les trois autres mesures sont dans la condition ordonnée je peux donc dire que les mesures répétées sont croisés autour de toutes les modalités du facteur tout à l'heure nous avions vu que lorsque toutes les mesures répétées se trouvaient à l'intérieur du nez une seule modalité d'un facteur on disait que les mesures répétées était niché à l'intérieur des modalités de ce facteur maintenant on vient de constater que lorsque au contraire les mesures répétées sont répartis entre toutes les modèles du facteur on dira que les mesures répétées sont croisés autour des modalités du facteur on va tenter de voir si les mesures répétées sont nichés à l'intérieur des modalités du facteur temps ou si au contraire elles sont croisés autour des modalités de ce facteur dans la mesure où certaines des mesures sont dans la condition 10 secondes que d'autres mesures sont dans la condition 20 secondes et qu'enfin les dernières sont dans la condition 30 secondes je peux affirmer que les mesures répétées sont croisés autour des modalités de ce facteur en résumé les mesures répétées sont croisés autour des modalités temps du facteur ghibli série que du facteur temps donc au tour de tous les facteurs en pet de notre design si bien qu'on va parler de plans croisés attention il est tout à fait possible d'avoir un ou plusieurs facteur temps dans les plans niche et que dans les plans croisés c'est vraiment la position des mesures répétées par rapport aux modalités de chaque facteur qui nous permettra de déterminer en présence de quel type de plan où se trouve si les mesures répétées sont nichées au sein des modalités de tous les facteurs du design on parlera de pleurnicher si au contraire les mesures répétées sont croisés autour des modalités de tous les facteurs du design on parlera de plans croisés enfin on va voir un troisième et dernier exemple dans lequel on verra que les mesures répétées sont nichées aérateurs des modalités de certains des facteurs du design et croisées autour des modalités d autres facteurs du 17 ce type de configuration est ce qui définit les plans mixte voilà cet exemple on dit que deux médicaments sont censés avoir un effet sur le temps de réaction de sujet hyper actif mais ne pas avoir d'effet sur des sujets qui ne sont pas hyper actif à chercheurs veut évaluer l'effet de deux médicaments comparé à un placebo sur le temps de réaction des sujets dans une série de tests classiques cinq sujets et hyperactif et 5 sujet d'un hyper actif participent à l'expérience est en mesure pour chacun d'eux la performance sous l'effet de chaque médicament l'ordre d'administration des médicaments est répartie de manière aléatoire et avec un délai suffisant entre chacun pour être sûr qu'il n'y ait pas d'effets combiné des différents médicaments la variable dépendante est le temps de réaction moyen exprimé en dixièmes de secondes aux différentes tâches et on s'attend à une diminution du temps de réaction de même ordre de grandeur pour les deux médicaments par rapport au placebo on dit aussi que cette diminution devrait être présente que je sujets qui sont hyperactifs on va commencer par identifier les vies et la bd dans ce design et déterminer leur nature afin de s'assurer qu'on est bien dans un contexte d' à nova on s'attend à une diminution du temps de réaction suivant qu'on ait pris un médicament ou un placebo et ce uniquement chez les sujets hyperactif voyez que à nouveau on n'a pas une seule hypothèse ici on en a plusieurs ce qui est marquant c'est que c'est le temps de réaction qui devrait varier en fonction de la condition le temps de réaction est donc bien la variable dépendante comme c'est d'ailleurs indiqué tout à fait explicitement dans l'énoncé c'est en fonction de deux facteurs que devrait varier le temps de réaction d'abord en fonction de la modalité du facteur médicaments il est indiqué qu'on compare deux médicaments à un placebo ce facteur est donc un facteur à trois modalités médicaments un médicament 2 vs placebo le temps de réaction est également censé varier en fonction d'un autre facteur qui est le fait d'être hyperactifs ou pas comme je lé déjà rappelé dans l'exemple précédent pour envisager une à nova à deux facteurs il est nécessaire qu'on est des bonnes raisons de penser qu'il existe une interaction possible entre nous deux facteurs or c'est bien le cas comme on peut le voir à travers cette phrase dans laquelle on sous-entend que l'effet du médicament ne sera pas le même chez les sujets hyperactif et chez les sujets non hyperactif en fait on pense que l'effet sera nul chez les sujets qui sont un hyperactif et qu'il sera non nul chez les sujets qui sont hyper actif voilà l'implication de l'interaction entre les deux facteurs qui m'amène à comprendre que je vais effectivement faire une à nova à deux facteurs et reste maintenant à déterminer si je vais faire une à nova à mesures répétées ou pas on a déjà vu que des mesures répétées pouvait survenir soit parce que l'individu statistique est constitué de plusieurs personnes physiques ou parce que plusieurs mesures ont été récoltés sur une seule et même personne parfois ces mesures répétées constitueront un facteur d'intérêts parfois pas on va analyser toutes les possibilités pour essayer de repérer combien est-ce qu'il ya deux mesures répétées par individu pour commencer on peut noter ici que l'individu statistiques visiblement un seul et unique sujet on a dit sujet en tout notre base de données et donc dix individus statistiques on va commencer par définir pour chacun des facteurs s'ils sont de type intra ou inter puisque comme vous le savez si un facteur de type entre ça amènera forcément la présence de mesures répétées le premier facteur est le facteur hyperactivité on a cinq sujet hyper actif et cinq sujets qui ne sont pas hyper actif a priori on a là des échantillons qui sont indépendants on n'a aucune indication dans l'énoncé du fait qu' il existe un lien important entre les personnes des deux groupes de raisonnablement on a choisi de manière aléatoire c'est un hyper actif et indépendamment cinq personnes qui ne sont pas hyper actif l'autre facteur quant à lui est par contre un facteur de type intra il s'agit du facteur médication à trois modalités et en spécifie que chaque sujet est mesurée sous l'effet de chaque médicament autrement dit chaque personne sera mesurée au moins trois fois avec les médicaments avec le médicament de et avec le placebo dans l'énoncé il n'y a aucune indication du fait que plusieurs mesures aient été collectés dans chaque modalité du facteur médicaments et donc il semblerait qu'il y ait trois mesures répétées par individu statistiques voici la base de données pouvait constater qu'il y a dix individus statistiques dans notre base de données comme on l'a déjà mentionné précédemment cinq hyperactif et 5 noeuds l'hyperactif je vais mettre en évidence un des individus statistiques et pour changer un peu je ne vais plus prendre le premier c'est vraiment juste pour vous montrer que peu importe sur base de quels sujets ont fait d'exercice ça ne change strictement rien il y a trois mesures répétées par un député statistiques je prends cet exemple 32 26 28 et je vais regarder comment se positionnent les mesures répétées d'abord par rapport aux factures hyperactivité et ensuite par rapport aux facteurs médication je constate que les trois mesures répétées se trouve dans une et une seule modalité du facteur hyper activité en l'occurrence dans la modalité d de l'hyperactif comme vous le savez maintenant je dirais alors que toutes les mesures répétées sont nichés à l'intérieur des modalités du facteur hyper activité par rapport aux facteurs médication maintenant je constate que les mesures sont répartis entre toutes les modalités du facteur médication et je dirais donc que les mesures répétées sont croisés autour des modalités du facteur médicaments en résumé les mesures répétées sont nichés à l'intérieur des modalités d'un facteur et croisées autour des modalités de l'autre facteur nous sommes donc bien en présence d'un plan et voilà donc de quelle manière vous devrez déterminer en présence de quel type de plan on se trouve nichée croisé au mixte en fonction de la position des mesures répétées par rapport aux modalités de chacun des facteurs dans la vidéo qui vont suivre je reprendrai les trois exemples que j'ai introduit dans cette vidéo 2 heart a développé le problème et tester les hypothèses de recherche