[Musique] bonjour dans cette vidéo nous allons apprendre à estimer une probabilité par échantillonnage l'idée serait en fait de répété de nombreuses fois la même expérience aléatoire c'est à dire on n'en connaît pas l'issue par exemple je laisse je lance un dé je ne sais pas s'il va tomber sur 1 2 3 etc donc on va répété de nombreuses fois cette expérience aléatoire afin de calculer la fréquence observé pour une des issues et ainsi à partir de ces fréquences observé d'en déduire la probabilité théorique ceci en s'assurant que l'estimation qu'on fera puisque ça sera une estimation sera fait sera de bonne qualité alors déjà parlons d'échantillons de notions d'échantillons qu'est ce que c'est que cet échantillonnage dont je parlais dans le titre bat pour mieux le comprendre trois exemples un premier exemple où on imagine une entreprise qui produit des petits circuits des petites cartes à puce ces petites cartes qu'on peut trouver dans ton téléphone dans un ordinateur dans n'importe quel produit électronique et on va prélever parmi le grand nombre de cartes à puces qui sont produites chaque semaine on va en prélever deux sens pour en étudier certains critères par exemple bien si elle fonctionne bien et bien on dira que c'est 200 cartes à puce constituent un échantillon de taille deux cent de la population de l'ensemble des cartes à puce et oui la population peut désigner un ensemble d'objets pas seulement des humains un deuxième exemple on s'intéresse maintenant aux intentions de vote lors d'une élection donc on va pas sonder tous les électeurs sinon ça serait le vote lui-même mais on va sonder seulement 1000 personnes ont leur demandant à chacun leurs intentions de vote et bien l'ensemble de ses mille personnes constituent un échantillon de taille milles de la population totale des électeurs cette fois ci la population d inga des humains un troisième exemple cette fois ci plus tourné vers les probabilités on lance une pièce de mode et 50 fois de suite et on les résultats obtenus et bien l'ensemble de ces 50 lancers constituent un échantillon de taille 50 alors de façon générale on peut maintenant définir un échantillon de taille n eh bien il est constitué des résultats de haine répétition d'expérience toutes indépendantes les unes des autres sur l'ensemble des personnes ou des objets on l'a vu sur lesquels porte l'étude statistique la population ingénieur à un échantillon issu d'une population et donc l'ensemble de quelques éléments de cette population on ne peut pas étudier toute la population alors on va en extraire un échantillon et l'étude va porter sur cet échantillon alors notre échantillon on va le réaliser virtuellement en simulant nos expériences aléatoire à l'aide d'un logiciel pourquoi cela parce que tout simplement qu'on le fasse virtuellement ou réellement ça n'a pas d'importance la démarche restera la même mais en utilisant un logiciel c'est évidemment beaucoup plus pratique et cela permet de générer un échantillon de grande taille et surtout de façon très rapide alors notre expérience aléatoire et la suivante elle consiste à lancer un dé 1,6 face et on va donc programmé à l'aide de python cette expérience afin de générer des lances étaient alors pour cela eh bien on va avoir besoin d'une fonction random qui va nous renvoyer un nombre compris entre un nombre entier compris entre 1 et 6 il va donc falloir importer le module random c'est ce qu'on commence par saisir et à partir de là eh bien on va définir une fonction d qui va nous retourner un indé donc une valeur d'un des compris entre 1 et 6 c'est pour ça qu'on va être air égalera int 1 6 en chine ce qui nous renvoie donc un nombre entier compris entre 1 et 6 ans sorti donc sorti de cette fonction return air de cette façon là et bien sera affiché une fois qu'on aura exécuté le programme la valeur du thé alors on l'exécuté ce programme et on obtient donc l'affichage ci contre cela signifie donc que ici à simuler un lancer des haies et on a obtenu ici 1,6 on voit qu'on peut relancer à nouveau tout simplement en rappelant de nouveau la fonction des on obtient à nouveau 1 6 on va le faire encore cette fois-ci on obtient 1 et une dernière fois et on obtient 1 5 alors on va rajouter une règle à notre jeu qui dit que si le résultat est un 1 ou 1 6 on gagne dans le cas contraire on perd et on va répéter une fois de suite cette expérience aléatoire à deux issues donc qu'ils sont gagner ou perdre et qui va consister à chaque fois à relancer le d du coup on est obligé de modifier de compléter un peu notre programme python afin de lui faire simuler n lancer de dés on voudrait que le programme affiche le nombre de fois où on a gagné en lançant elle lancé de dés alors pour cela et bien on va avoir besoin d'une variable qu'on va appeler s et qui va compter à chaque fois qu'on lance un dé si le résultat est un ou 6 et 7 variable va à la fin de ces haines lancé nous dire combien de fois on a obtenu 1 1 ou ainsi c'est à dire combien de fois on a gagné alors au départ quand on n'a pas encore commencé à jouer évidemment pour l'instant on a obtenu 0 x 1 1 ou 1 6 on n'a jamais gagné donc on initialise notre variable à 0 ensuite eh bien on va construire une boucle qui va nous permettre de lancer donc une fois note d donc on le voit fort qu'à une rage elle afin donc de lancer ces énoncés on garde le calcul de la valeur aléatoires donc comprise entre un et six cents en aura besoin à château de boue de cette façon là à chaque tour de boucles air va changer de valeur et suit un petit test qui va nous permettre de savoir si on a obtenu 1 1 ou 1 6 bat tout simplement if he régal 1 ou et régale 6 de cette façon là eh bien dès que air est égal à 1 ou 6 c'est là qu'on gagne eh bien on a cru mende s-21 autrement dit la valeur de s augmente de 1 et de cette façon là quand on aura fait tourner autour de boucles et bien le logiciel le programme aura calculer le nombre de fois qu'on aura obtenu 1 ou 6 on va ainsi lui demander de nous retourner s en sortir mais avant d'exécuter le programme il ya une petite chose encore à modifier il va falloir maintenant attribué une variable à la fonction dès qu'on n'avait pas besoin tout à l'heure et cette variable bien évidemment cn de cette façon là on va pouvoir choisir au moment où on exécute le programme combien de fois on joue combien de fois où l'on lance note d voilà le programme est maintenant complet on peut le tester une nouvelle fois on va donc exécuter le programme et on va commencer par lui demander de lancer d'idées donc des dix on obtient 2 2 ce qui signifie donc que sur 10 lancers de dés on a gagné deux fois on a obtenu donc 1 1 ou 1,6 seulement deux fois on le lance à nouveau avec des 10 de nouveau cette fois ci on a obtenu 3 1 ou 6 on le lance une dernière fois on va changer un petit peu on va lancer maintenant 15 des et là on obtient 8 ce qui ne signifie que cette fois ci on a gagné huit fois sur 15 lancers alors la question qu'on pourrait maintenant se poser c'est que se passe-t-il lorsque n augmente c'est à dire lorsque le nombre d'expériences de nombre de jeu devient de plus en plus grand bien pour cela on va tout simplement tester notre programme est alors au lieu de tester sur les effectifs c'est à dire sur le nombre de gains on va le trait le tester sur les fréquences c'est juste une question d'affichage on va lui demander qui nous qui nous renvoie en sortie la fréquence des parties gagnées je vais donc simplement remplacer ray turn s parent s sur aisne ce qui revient quasiment au même jeudi vise simplement par le nombre de lancers total et on va rejouer en recommençant de nouveau on va commencer par lens est dit et on obtient 0 3 on augmente on va passer à 100 lancers de dés maintenant des 100 0,34 et puis on va aller maintenant carrément à 1000 on va lancer 1000d et on obtient 0,3 135 on constate que plus elle devient grand plus les fréquences observé semble se rapprocher d'une valeur théorique valeur théorique proche de 0,33 à priori mais il ya quelque chose qu'on n'a pas dit c'est que pour ce jeu quelque part on pourrait la calculer la probabilité théorique parce que la probabilité de gagner elle se calcule comment on a dit que pour gagner il faut avoir un 1 ou 1 6 autrement dit on a deux issues pour gagner sur combien sur six issus en tout finalement la probabilité de gagner elle est de 2 6e jeu la note b égale à 2 6e mais de 6e ça s'écrit également un tiers or un tiers une valeur approché de la matière c'est bien connu c'est 0.33 donc on remarque bien ici que finalement la fréquence observé semble se rapprocher de 0.33 0.33 valeurs très proche d'eux la probabilité théorique on a envie de dire lorsque n devient grand sauf exception la fréquence observé est proche de la probabilité est bien ceci ça s'appelle la loi des grands noms qui dit que et bien plus n est grand plus la fréquence observez donc celle de la réalité un pourrait faire la même chose en lançant les des jeux l'éditeur ça serait juste beaucoup plus long et bien plus cette fréquence observer se rapproche de la théorie de la probabilité mais alors si la fréquence observer se rapproche de plus en plus de la valeur théorique comme on vient de le voir c'est très intéressant parce que admettons qu'on se retrouve face à une expérience dont on ne sache pas calculer la probabilité est bien on pourra faire des expériences aléatoire simulé tout ça pour obtenir une fréquence observé à il faudra comme on l'a dit avant avoir un n qui soit assez grand mais on pourra effectuer des simulations afin d'obtenir une estimation de cette probabilité maintenant ce qui va nous intéresser c'est la qualité de cette estimation est ce que cette estimation est de bonne qualité pour cela on se propose maintenant de répéter grant n fois la simulation de l'expérience aléatoire précédente alors attention il ne faudra pas confondre grand tu n es petit tu n on va répéter grands thèmes fois l'expérience qui est de jeter petit n fois inde et donc dans chaque cas c'est à dire pour les grands à une fois avec un petit n suffisamment grand l'a bien compris la fréquence observé qu'on va maintenant appelée petite f devrait être proche de la probabilité théorique peu cheap et donc peu cheap et qui est égale à un tiers la question est la suivante comme petit f la fréquence observé est proche de petits pets on voudrait mesurer cet écart entre petit f et peu cheap et pour grands et simulation on va faire grand une fois cette simulation et on va à chaque fois mesuré l'écart qu'il ya entre les deux et pour cela et bien on va calculer la proportion des cas pour lesquels les cas entre petit f et petit p est inférieur ou égal à 1 sur racine de haine ça fait beaucoup d'informations tout ça est le lieu pour comprendre c'est de partir d'un exemple on va prendre petit n égale à 100 et grant n égale à 5 ce qui veut dire qu'on va répéter cinq fois l'expérience qui consiste à jeter 100 x 1 d donc on va commencer par jeter 100 fois inde et puis on va de nouveau jeté sans point d etc et on va faire ceci cinq fois alors grand n égale à 5 c'est pas assez si on voulait vraiment faire une bonne estimation mais l'idée ici je le répète c'est juste de comprendre on va déjà voir que c'est assez long en le faisant cinq fois donc commençons déjà par lancer une première fois cent fois un dé et on va à nouveau compter la fréquence des gains la fréquence de fois où on obtient 1 1 ou 1 6 on fait donc des sens et on obtient 0,33 premier tour eiffe égal à 0,33 et ce qui nous intéresse c'est la différence entre la fréquence observer et la probabilité théorique c'est à dire f - p alors cette différence f - paix serait donc de 0.33 moins un tiers alors le truc c'est que ici 0.33 moins un tiers serait un nombre négatif nous on voudrait juste à voir la différence en valeur absolue c'est à dire la différence sans le signe pour cela et bien on a une fonction qui s'appelle la fonction valeur absolue on met donc des bars autour de f - p autour de 0.33 moins un tiers cela signifie juste que le signe du résultat sera forcément un nombre positif donc quand on fait 0 20 33 - un tiers on trouverait quelque chose du type 000 3 3 3 3 avec 1 - devant vu que on a mis valeur absolue il ya plus de moins devant cas ce que je voudrais savoir c'est juste si cet écart entre f épais et plus grand ou plus petit que 1 sur racine carrée de haine c'est avec un sur racine carrée de haine que je veux comparer cette différence est bien on peut calculer un sur racine carrée de haine parce que n est connue elle fait sens ça fait donc un sur racine carrée 200 mes racines carrées de son c 10 autrement dit c'est du un dixième et un dixième passe à fait 0,1 tout simplement ce qui veut dire que je vais vouloir comparer la différence entre f ep avec 0,1 et ça on l'a vu tout à l'heure cette différence est bien inférieure à 0,1 on recommence et on passe à grand peine égale à 2 2e tour on va de nouveau lancé sans des et calculer la fréquence des gains on y va on lance et on trouve 0,48 donc cette fois ci la fréquence observé est de 0,48 et je voudrais calculé comme tout à l'heure la différence entre f la fréquence observé ep quand on fait la différence entre 0,40 et un tiers cette fois ci on trouve un nombre qui est supérieur à 0 1 qui je le rappelle est un sur racine carrée de l'aisne on poursuit avec troisième tour on lance un nouveau sens d on trouve 0,34 grand theft itf pardon égal à 0 34 et quand on fait 0 34 - un tiers on trouve une différence inférieur à 0 1 4e lancé et on trouve à nouveau 0 34 alors là c'est pas la peine de le refaire on peut directement dire que la différence est à nouveau inférieur à 0,1 c'est le même résultat que pour le 3ème dernier expérience on lance une dernière fois sans des et on trouve une fréquence de 0,19 petit f égale 0,19 et quand on fait la différence de f ep on trouve un nombre qui est supérieure à 0,1 alors je vous rappelle que ce qui nous intéressait c 2 c'était de savoir quelle est la proportion des cas où la différence entre la fréquence et la probabilité théorique est inférieur à 1 sur racine carrée de haine qu'elle suffit de compter 1 2 3 3 sur combien trois sur cinq bien trois sur cinq ça fait 60 % on peut donc dire que dans 60 % des cas la différence entre fréquence observer et proportion théorique est inférieur à 1 sur racine carrée du mi6 0,1 mais comme dit avant grand n est trop petit pour travailler avec un n grand va pas le faire à la main on l'a bien compris on va à nouveau simuler les expériences à l'aide du programme que l'on va encore complétée et pour cela et bien on va rajouter une nouvelle fonction une fonction est-il comme estimation qui aura deux variables bien évidemment grand tu n es petit tu n es tu pour calculer donc la proportion de fois où on se trouve avec un écart inférieur à 1 sur racine carrée de m on va être obligé intégrer un nouveau compteur compteur qu'on va appeler c est comme d'habitude pour un compteur on commence par l'initiale is et donc c'est égal à zéro ensuite on va créer une nouvelle boucle une boucle qui va faire que à chaque fois on va recommencer à lancer petit end et comme tout à l'heure on avait lancé donc on avait simulé cinq fois de suite le lancer de sang d alors pour cela une boucle fort cas il règne quarantaine et ensuite eh bien on voudrait obtenir la fréquence observé pour chacun de ces grands ten ex pour chacune de ces grands ten expérience mais a pour cela s'avère assez simple parce que il suffit de faire appel à l'autre fonction qu'on a encore ici la fonction des qui elle justement nous renvoie la fréquence observé on va donc appelé petit f la fréquence observer et on va écrire petit f égale des deux petites haines ensuite et bien ensuite il faudra faire un test est ce que une fois que cette fréquence a été simulée a été calculé on se trouve bien avec un écart qui est inférieur avec une amplitude qui est inférieur à 1 sur racine carrée de haine pour cela donc on va mettre en place une instruction conditionnelle if la différence entre f ep c'est à dire la différence entre f et un tiers cette différence on a dit qu'on l'avait en valeur absolue sans le signe on s'intéresse pas aux sims est juste l'écart qu'il ya entre les deux que l'une soit plus grande que l'autre ça n'a pas d'importance valeur absolue c'est la fonction apps abs 2 f mois un tiers s s inférieur ou égal à 1 sur racine carrée de n1 sur sqr t2 n la racine carrée du coup on va avoir besoin au module mat pour apps et sqr t on va donc au début du programme rajouter une ligne pour appeler le module mat au moment où on lance le programme que se passe-t-il si effectivement cette différence est inférieur à 1 sur racine de haine et bien tout simplement on compte on va augmenter notre compteur 2 1 c'est égal c'est plus sain ensuite on sort de l'instruction conditionnelle on sort de la boucle et on va simplement demandé au programme qui nous renvoie la fréquence donc la proportion qui sera donc égale à ces petits c / grands thèmes le nombre de fois où on a lancé 100 fois inde et voilà notre programme est maintenant terminée on peut encore une dernière fois le compiler et bien sûr l'exécuter on va commencer donc pas exécuter ce programme avec grant n égale 10 est petit est légal 10000 et on trouve eh bien on trouve un tout pile alors bien sûr il s'agit d'une valeur à approcher on se doute bien que c'est certainement pas dans 100% des cas mais on doit en tout cas être très proche donc on voit déjà que cette estimation semble être de qualité on va lancer une nouvelle fois notre programme avec cette fois-ci grand n égale 50 et on va garder petit est légal 10000 et on trouve 0,96 là encore on voit que dans 96% des cas on se retrouve avec une fréquence observée et une probabilité théorique qui sont très proches l'une de l'autre et on continue avec vente n égale à 100 on trouve 0.98 on refait on trouve maintenant à nouveau un et on refait une petite dernière fois et on trouve 0,96 eh bien on sait par expérience qu'on va trouver des valeurs qui sont très proches de 0.95 de 95 % ce qui signifie l'écart entre la fréquence observé petit f et la probabilité théorique petit p est inférieur ou égal à 1 sur racine carrée de haine alors ce n y s'y est égal à attention ce n'est plus sans mais c'est cette fois ci dix mille on peut donc calculer cette amplitude donc un sur racine car elle de haine soit un sur racine carrée de 10000 racine carrée de 10000 c'est égal à 100 c'est donc du 1 100e soit 0,01 eh bien on voit que tous les résultats qui sont affichés la signifie que dans 95 % des cas les cas entre la fréquence observer et la probabilité théorique est inférieur ou égal à 0,01 c'est quand même quelque chose de très près de très précis et on peut enfin écrire le principe de l'estimation qui nous dit que pour elle assez grand f la fréquence observé donne une bonne estimation de paix notre probabilité théorique dans 95 % des cas cette séquence est terminée