Astrophysique et Intelligence Artificielle - Brice Ménard

bonsoir à tous et bienvenue pour nos conférences mensuelles de l'institut d'astrophysique de paris donc ça fait plaisir que nous recevant du public encore un peu clairsemé parce que nous avons toujours des contraintes sanitaires mais nous sommes très heureux d'accueillir du public et d'accueillir des internautes sur youtube nous continuons à diffuser une conférence sur la chaîne youtube de l'institut d'astrophysique de paris et donc pour ceux qui sont rares ceux qui sont dans la salle vous aurez moyens à la fin de la présentation de ce soir d'intervenir poser des questions faire des commentaires et pour les internautes qui nous suivent sur youtube vous pouvez mettre vos commentaires posez des questions sur le tchat et moi je suivrai le chat durant la conférence et je retranscris rey à notre orateur les commentaires et les questions que j'y trouverai et donc je vous annonce pour la prochaine conférence le mois prochain elle sera donnée par notre collègue de l'institut d'astrophysique de paris henrie mccraken qui nous parlera de grandes structures et de l'univers primitif notamment avec les télescopes spatiaux james webb et au clip est pour ce soir nous avons le plaisir de recevoir brice ménard ici donc à l'institut d'astrophysique de paris dont brice tué professeur au département de physique et d'astronomie de l'université johns hopkins à baltimore un département qui m'est cher même si j'ai eu le plaisir du travail il ya quelques années et donc tu as fais ça tu as fait ta thèse avant ici même à l'institut d'astrophysique de paris donc que tu a soutenu la hausse il ya quelques années pareil ici même et donc par la suite tu as travaillé à différents endroits à princeton aux états unis toronto au canada tokyo japon à différents endroits la tuer pour un an donc ans est en séjour en france à l'école normale supérieure tes sujets d'étude donc c'est l'astrophysique et puis l'étude de tout un tas de données en appliquant des méthodes statistiques assez élaboré que tu appliqué à différents à différents domaines notamment la matière noire autour des galaxy le milieu interstellaire le milieu intergalactique l'étude des gars du gaz des poussières les décalage vers le rouge les mesures de distance extragalactique et eu à développer des recherches de thématiques pour sortir donc des informations des jeux de données complexes en appliquant ce à différentes thématiques également sur la sismologie terrestre 1 je crois donc au delà de l'astrophysique tut tut en scène donc à l'université johns hopkins en enseignant donc l'astrophysique et l'analyse de données et donc ce soir eh bien tu vas nous présenter une conférence intitulée astrophysique et intelligence artificielle donc je t'en prie je voudrais remercier à l'institut d'astrophysique de paris pour organiser cette série de conférences un grand public qui est très intéressante aujourd'hui je vous parlais d'astrophysique et d'intelligence artificielle comme vous savez peut-être l'analyse d'image a été quelque chose de deux clés de très important dans l'évolution de l'intelligence artificielle je vais en parler aujourd'hui et en parallèle de cela en astrophysique bien entendu l'analyse d'image est quelque chose de fondamental quelque chose qui est à la base et l'astrophysique donc on va voir aujourd'hui comment un petit peu dans ces deux domaines les choses ont évolué au cours des vingt dernières années alors je vais commencer par à vous montrer quelques images d'astronomie des images qui sont un très connu pour un pour certaines que vous connaissez peut-être des images qui pour la plupart sont magnifiques 1 voilà par exemple ici une distribution un de gaz dans notre galaxie voici la nébuleuse du crabe inquiète une étoile qui a explosé qui a été vu en 1054 il ya plus de mille ans qui à milan à 1 par les chinois qui étaient visibles à l'oeil nu un mois ci une galaxie un proche de la nôtre voici 10 qu'une distribution de poussière dans une galaxie proche on peut continuer avec plein d'autres images comme celles ci un zone de formation des toiles dans notre galaxie ces images sont très belles elles sont souvent très colorées et un pour beaucoup ce sont les images qui est vraiment nous attire vers l'astronomie quand on les voit on a envie d'en voir plus on a envie de comprendre les choses de plus près et ce qui est intéressant ce qui est peut-être une surprise pour beaucoup d'entre vous en faite c'est que ces images ces images qui sont les plus belles en astronomie sont les images qui sont les plus durs à analyser et en pratique un extrait en fait seulement une toute petite partie de l'information de ces superbes images ok donc en fait cette richesse qui fait la beauté des images d'un autre côté c'est un vrai challenge quand il s'agit quand il s'agit d'analyser les données je vais vous montrer un exemple dans un autre régime si je prends cette image l'est peut-être moins belle que les précédentes ce qu'on voit ici donc c'est une image du ciel profond qui a été prise avec un télescope pieds sur terre hélas ce que vous voyez c'est tout un tas de galaxies mais la résolution n'est pas très bonne passe que donc quand on observe depuis la terre des objets très petit très lointain la turbulence qui est dû à l'atmosphère 1 va rendre ces images un petit peu moins précise et en fait quand on analyse ce type d'image par contre il n'y a aucun problème ok on peut extraire quasiment toute l'information qu'on veut extraire de ces données et la raison est simple c'est que quand je regarde une image comme ça je peux la décrire ok ce que je vois ici c'est une série d'objets de blogs qui n'ont pas des formes très compliqué ok ils sont à peu près circulaire un peu elliptique des fois et en fait ce que je peux faire c'est de détecter tous les objets cas dans cette image et je peux les caractériser avec leur position leur taille leur orientation leur couleur etc donc j'ai juste besoin d'une petite série de quantité et une fois que j'ai cette description là qui va être en fait une liste d'objets de paramètres jeu peut recréer une nouvelle image et si je recrée une nouvelle image pour celle ci voilà ce que j'obtiens si vous n'avez pas eu beaucoup de différence c'est qu'en fait les deux images sont très très semblables je vous remonterez voici l'image originale qui est une observation astronomique je détecte tous les objets j'extrais leur propriété et maintenant je régénère une nouvelle image juste avec ses propriétés et comme vous voyez la différence entre les deux est très très petit ce que je peux faire c'est que je peux faire la différence entre ces deux images entre l'image originale et mon image recréer ce que j'obtienne oscars et s'appelle li résiduelles et on obtient quelque chose qui est quasiment zéro ok c'est pas parfait comment voit il reste quelques petites choses qui fait que ce qui veut dire qu'on n'a pas décrit les choses de façon exacte mais on a fait du très bon boulot ok ce qui veut dire qu'on a réussi à extraire quasiment toute l'information qu'on veut extraire d'une image comme ça donc en fait on a une certaine façon de régime quand on regarde l'image du haut on est dans un régime où on n'a aucun problème on peut extraire toute l'information de tous les pixels qui a dans cette image mais maintenant quand on regarde les images ba qui sont une certaine façon beaucoup plus jolie beaucoup plus attractive beaucoup plus riches quand on analyse les données de ce genre d'image on extrait qu'une toute petite fraction de l'information et ça c'est vraiment dommage parce que ces images ont beaucoup plus à nous dire maintenant je voudrais introduire un mot clé qui caractérise les images que vous voyez en bas ces mots texture dès qu'on commence à parler de textures les choses se compliquent très vite ok c'est pour cela que quand on essaye d'analyser des données qui sont dans ce régime les choses beaucoup plus difficiles alors essayons voir devant un petit peu ce qui se passe c'est comment est-ce qu'on analyse des données alors je prends un exemple tout simple j'ai une image à gauche et je vais extraire de l'information de cette image pour le faire je vais avoir besoin d'un cerveau ok maintenant ce cerveau avait être capable d'extraire de l'information suivant le type de langage auquel il a accès aux quais type de vocabulaire si vous voulez et on peut parler de différents types de langage on peut parler par exemple complexe décrire les choses en français ou en anglais ou dans d'autres langues si vous parler plusieurs langues vous savez très bien qu'à certaines choses qui sont plus faciles a décrit dans une langue que dans une autre cadre mois déjà qu'elle est différente et langage on peut utiliser un langage mathématique statistiques on peut utiliser des notions de physique on peut utiliser un langage informatique qui ont un langage visuel dont il ya tout un tas d'aborder le problème de d'extraction de l'information et donc chaque langage pour avoir des limites associées est ce que je vais essayer de vous montrer c'est que c'est une dune un aspect fondamental qui nous limite dans l'analyse des données en général pas seulement en astrophysique mais un petit peu partout alors pour vous montrer un exemple très flagrant de ses limites on va faire l'expérience suivante voici une image imaginez que vous deviez décrire cette image par téléphone à un ami vous voyez l'image et vous devez par téléphone ou d'écrire ce que vous voyez pour qu'il puisse la comprendre peut-être pour qu'ils puissent l'a dessiné lui-même hockey j'imagine que tout le monde ici peu à peu près arrivé à faire ça maintenant voici une deuxième image qu'il faut décrire et par téléphone comment allez vous décrire cette image une différence fondamentale entre les deux là ce qui se passe dans le gard de droite c'est que les mots nous manquent on ne sait pas vraiment comment décrire toutes ses formes qu'on voit un risque important de mentionner ici c'est qu'en fait ces deux images sont des images qui sont d'une certaine façon dont qui sont pas sont pas des gros images ok il ya à peu près 200 pixels un autre côté ce sont juste des images qui sont en noir et blanc n'est pas des niveaux de gris différent des couleurs et c'est donc d'une certaine façon il ya une grande simplicité dans ces images et on voit qu'il faut pas aller chercher très loin pour trouver des exemples pour lesquels le langage l'anglais ou les approche mathématique ici ne nous permet pas vraiment de décrire les choses comme on le souhaite donc le message important ici c'est qu'il ya vraiment des limitations fondamentale clés qui sont dues au langage qu'on utilise quand on veut extraire de l'information de quelque chose ou quand on veut te décrire quelque chose donc revenons à cette analyse de données comment est-ce qu'on extrait de l'information donc on va être limité par le langage maintenant si on prend le cas de l'astrophysique on a des données qui viennent de tout un tas de télescopes qui sont fantastiques autour de la terre donc j'ai montré quelques exemples ici le télescope japonais subaru on a le rugby observatory qui va bientôt être en service on a des télescopes dans l'espace comme le projet le clip qui est gérée par les européens et son cousin américain qui partirent un petit peu plus tard dans l'espace ces projets sont massifs les projets au sol coûte des centaines de millions d'euros les projets spatiaux généralement sont de l'ordre d'un milliard d'euros on passe une dizaine d'années à les construire un ensuite on passe cinq à dix ans à observer le ciel a accumulé des données pour ensuite les analyser ok donc ce qui se passe avec tous ces projets c'est le cas en astronomie c'est le canon plein d'autres disciplines scientifiques la quantité de données est absolument énorme et les astronomiques dans ce cas là et donc pour les analyser ce n'est pas un cerveau humain qui va s'en charger il va falloir utiliser un cerveau artificiel aujourd'hui on a on arrive on atteint le niveau observé à peu près 1 milliards de galaxies dans le ciel et vous comprenez bien qu'un une personne seulement ne peut pas à l'oeil nu regarder un milliard d' images des galaxies la vie humaine est trop courte pour ça et donc toutes les analyses scientifiques où la plupart des analyses scientifiques transitent par des ordinateurs hockey et ce qui est important de voir ici c'est que ces ordinateurs il va falloir leur enseigner un langage pour qu'il puisse extraire les données et quand on a un système comme celui ci où on a des photons qui vont traverser l'univers pendant des milliards d'années qui vont être détectées par le télescope qui sont à la pointe de la technologie on va avoir des miroirs qui vont être poli au nanomètre près les photos vont passer par des lentilles kémo d'une qualité extrême on va utiliser des détecteurs qui sont certains des détecteurs les plus puissants du monde les plus sensibles au monde on va donc détecter ces photons ils vont être transformés en électrons on va sauver ça crée un signal qui va être sauvée sur un disque dur qui donc ça va nous donner les données à analyser si au final on a un système avec un ordinateur qui n'est pas capable d'extraire toute l'information donc dans ce cas là à quoi bon avoir des instruments aussi sophistiquée des projets à aussi grande échelle si au final on a une efficacité qui est seulement de 10% et c'est 90% de l'information n'est pas extraite des données ce serait bien dommage donc on peut essayer de regarder un petit peu plus près comment les choses sont faites en astrophysique et un pour cela on peut utiliser une une cote de richard feynman qu'un grand physicien 1 du xxème siècle qui nous dit why cannot create and do not understand que je ne peux pas créé je ne le comprends pas et donc un très bon exercice pour savoir si on comprend bien les choses c'est d'essayer de recréer ce qu'on voit à partir de notre description de notre présentation ce que je peux faire ici c'est utiliser un certain langage mathématique informatique qui sera donc dans l'ordinateur extraire de l'information de ces données est à partir de cette information je vais recréer une nouvelle image pour voir si ça ressemble ou non à l'image de début et si j'ai de cette capacité je vais pouvoir recréer autant d'image que je veux qu'ils vont ressembler à l'image du début qu'il wade même type d'image donc on peut essayer de voir ce qui se passe et c'est là où les choses sont assez surprenantes si je considère les techniques qui sont utilisés aujourd'hui en astrophysique et dans plein de domaines scientifiques voilà à quoi ça ressemble je prends l'information qui a été extraite par l'ordinateur je recrée des images du même type avec cette information dans ce cas là il s'agit du spectre de puissance pour ceux qui qui savent de quoi il s'agit voilà à quoi ça ressemble comme on peut le voir les images qu'on recrée ici sont très très différentes des images qui sont en entrée ce qui veut dire qu'une grande partie de l'information n'a pas été conservé quand on fait cette extraction ce qu'on fait ici ce qu'on utilise des outils statistiques qui ont été inventé dans les années 60 est en fait ya un certain contraste entre la le type d'outil statistique qui maintenant donc date dia qui beaucoup de gays qui est à dire des années et ces instruments qui sont la pointe de la technologie aujourd'hui donc il ya vraiment un déséquilibre un petit peu entre les deux mais ce qui se passe c'est pas qu'on n'a pas qu'on n'utilise pas des outils plus récents ce qui se passait quand fait en statistiques il n'y a pas eu beaucoup d'évolutions dans ce genre de domaine entre les années 60 jusqu'aux années 2000 il ya eu certaines améliorations et je vous en montrer une ici c'est une situation dans laquelle on extrait 1 le speck de puissance et des statistiques d'ordre supérieur je vais pas rentrer dans tous ses détails mais ça c'est en gros la pointe de la technologie de l'analyse a donné en astrophysique quand on est au début des années 2000 ok 2000 même jusqu'à 2010 et comme on peut le voir donc là c'est un petit peu mieux on voit que les concentrations jaune qui avait au début dans l'image de départ ont d'une certaine façon on en retrouve certaines dans les images d'arriver ici mais de même énormément toute une fraction de l'information a n'a pas été extraite des données donc il ya vraiment c'est vraiment dommage c'est que quand on en est à ce stade là il ya énormément d'attention qui est porté le long 2 c'est au cours de ces projets a essayé de conserver tous les photons conserver l'information les propriétés des photons une fois qu'on allait donner malheureusement on est capable d'extraire seulement une fraction d'information ce que je vous montre ici ça correspond au résultat de cosmologie par exemple qui sont qui date juste d'il ya quelques années ok ce sont les techniques qui ont été utilisés jusqu'à très récemment en astrophysique et en cosmologie et ce genre d'outils statistiques sont les outils classiques qui sont utilisés dans la majorité un des domaines scientifiques ok donc comme vous le voyez auquel la limite ici c'est pas la taille du télescope c'est pas la puissance de calcul la limite c'est vraiment le langage qu'on donne à l'ordinateur pour pouvoir extraire l'information des données donc comme vous pouvez l'imaginer ce qui a changé récemment c'est l'arrivée de cette fameuse intelligence artificielle alors juste un petit mot la majorité des gens qui travaillent dans le domaine ne parle jamais d'intelligence artificielle parce que c'est quelque chose qui a évolué au cours du temps la définition n'arrête pas de changer elle est par le même pour l'un et pour l'autre très souvent on parle de machine learning donc la machine qui apprend l'intelligence artificielle ou machine learning comme vous le savez c'est tout autour de nous on a ça maintenant dans les smartphones il ya c'est intégrer dans les appareils photos pour détecter les visages dans les images ça fait parti des technologies qui sont utilisés pour un reconnaître de la voix si vous parlez à syrie ou si vous parlez alexa par exemple c'est l'intéressé ce sont des techniques de machine learning c'est utilisé pour traduire des langues du français vers l'anglais vers le chinois c'est utilisé pour les voitures qui maintenant sont autonomes et peuvent conduire tout seul c'est utiliser en tout un tas de décisions médicales donc c'est tout autour de nous essayons de voir un petit peu de plus près ce qui s'est passé sur les vingt dernières années ou plus si on regarde l'histoire un de ces domaines en fait y'a que certains moments clés où la machine est arrivé à voir une performance meilleure que celle des humains donc cette histoire elle a commencé à peu près dans la fin des années 90 ou en 97 kasparov le champion mondial de chèques se fait battre par la machine pour la première fois ok ça a été un moment très important où la machine sur place l'humain si on continue dans l'histoire on arrive en 2011 avec le jeu de jeopardy aux etats unis c'est valant de questions pour un champion je crois en france où là la machine qui s'appelle watson a gagné toute la compétition si on continue dans le temps on va qu'il ya toute une explosion de situations pour lesquelles la machine de vence l'homme ok ça commence avec les jeux de vidéos atari ou la machine bateau les humains ensuite on passe au jeu de go et ensuite il ya tout un tas de choses j'ai pris quelques exemples ici diagnostic légal diagnostic médical et l'année dernière en 2021 on a eu un résultat qui est la communauté le résultat qui c'est remarquable vous lasse il s'agit pas de battre un humain mais la machine a battu toute la communauté scientifique qui s'attaquait aux problèmes de protéines folding donc de de pliage des protéines qui est quelque chose d'important dans la compréhension du monde vivant il ya quelque chose d'assez important ici c'est qu'il ya une différence entre ce qui s'est passé avant 2012 c'est pour ça que je les utilise et j'utilise à couleur bleue et ce qui s'est passé après 2012 les techniques qui ont été utilisés avant 2012 sont des techniques qui sont basées sur des mémorisation massive est en fait aujourd'hui on n'appelle pas ça de l'intelligence artificielle qu'est ce qui a été fait c'est juste de mémoriser toutes les les les configurations possibles en tout un tas de configuration dans un nul dans un jeu d'échecs où tout un tas de savoir pour le jeu de jeopardy et quand une question est posée on va essayer de trouver la réponse un parmi les données qu'on a par contre quand on est après 2012 c'est très différent là il s'agit d'apprentissage si je prends l'exemple du jeu de go par exemple il ya tellement de configurations possibles au jeu de go que ça ne tient pas dans la mémoire de n'importe quel ordinateur sur terre aujourd'hui ok c'est un nombre astronomique et donc on peut pas juste mémoriser les configurations là ce qu'il faut c'est vraiment apprendre à développer des stratégies ok donc il ya vraiment quelque chose qui est très différent si on regarde les choses après 2012 je vais également citer un autre exemple qui date de 2010 est une chercheuse japonaise qui a développé un système qui permettait de passer tous les tests d'entrée à l'université au japon dans 60% des universités au japon l'algorithme était capable passé le test de répondre à toutes les questions il y avait des questions de maths il y avait aussi des questions pour lesquelles il fallait écrire un essai sur un sujet donné l'algorithme arriver à être admis à l'université ainsi on regarde ce qui s'est passé dans la littérature si on prend tous les livres en français on regarde le mot intelligence artificielle on voit donc ça ça vient de google qu'il y a vraiment un changement en 2012 on a parlé d' intelligence artificielle depuis très longtemps on voit qu'en 2012 la tendance se met à monter très vite ok c'est vraiment passé quelque chose si on regarde dans la littérature scientifique c'est pareil si on prend tous les papiers qui ont été publiés en astrophysique entre 2020 entre 2000 et 2020 pardon on peut regarder tout un tas de mots clés si on regarde la recherche sur les étoiles et les galaxies on voit que la fréquence de ces mots clés n'a pas trop changé sur 20 ans on regarde un hautement comme les planètes qui comme vous le savez peut-être si vous vous êtes si vous suivez l'actualité astrophysique la découverte des exoplanètes a vraiment créé toute une nouvelle discipline ici qui s'est mis à croître au cours des 20 dernières années maintenant si on se pose la question de qu'est ce qui se passe avec le machine learning et en particulier ces fameux réseaux de neurones dont je vous parlais bientôt voilà ce qu'on voit dans la littérature c'est une explosion littérale sur les quelques dernières années et comme vous voyez à nouveau il se passe quelque chose alentours de 2012 alors qu'est ce qui s'est passé alors avant peut-être vous dire ce qui s'est passé essayons de comprendre les choses 1 quel est le challenge et quelle est la réponse apportée par de machine learning si je veux dire un ordinateur de détecter un cercle auquel j'ai besoin de lui donner la position du centre du cercle x et y est le rayon du cercle hockey est en gros ça suffit pour détecter un cercle dans une image maintenant si moi je dessine à la main des cercles et je voudrais dire à un ordinateur je voudrais expliquer comment détecter ces cercles la situation est beaucoup plus compliquée parce que là je n'ai pas besoin juste de lui donner le centre et le rayon il va falloir que je lui explique aussi toutes les déformations possible des cercles ok je peux avoir un stade qui peut être un peu plus aplatie dans cette direction ou dans cette direction je peux avoir un cercle où il ya un trait qui dépasse un petit peu un autre cercle il manque un petit bout du cercle et comme vous pouvez le vol voir il comprendre maintenant pour décrire toutes les possibilités de cercle qu'on pourrait trouver si quelqu'un dessine des cercles il va falloir expliquer un ordinateur toutes les déformations possible de ces cercles imparfait et cette liste est énorme ok cette liste en gros ne s'arrête jamais donc c'est pas vraiment la bonne approche si je veux expliquer un ordinateur si je veux lui enseigner un langage pour détecter des cercles la même chose ainsi il s'agit de détecter de la voit donc assez jeudi le mot bonjour deux fois bonjour bonjour la deuxième fois va pas être exactement la même que la première maintenant si vous dites le mot bonjour pareil il va être un petit peu déformé par rapport à la façon dont moi je les dis et donc pour expliquer un ordinateur comment reconnaître ce mot il va aussi falloir expliquer toutes les déformations possible du mot bonjour et le problème c'est que c'est un espace qui est vraiment énorme et beaucoup trop grand même chose avec la détection d'un chat dans une image qui en fait l'exercice typique un machine learning des réseaux neuronaux aujourd'hui comment faire pour détecter un chat dans une image c'est quelque chose qu'on ne savait pas bien faire si on est par exemple l'un autour des années 2000 pourquoi est-ce le cas un chat c'est quelque chose qui semble relativement simple un chat adulte a à peu près cette taille une tête captée une queue et très souvent on voir les chats dans ce genre de configuration donc on pourrait essayer d'expliquer un ordinateur à quoi ressemble un chat le problème c'est que si j'utilise juste ce genre un de position ça va pas être suffisant pour être capable de détecter les chats dans la majorité du temps parce que en même temps que ça il ya tout un tas de configurations possibles qui sont peut-être rare mais qui existe et qu'on trouve régulièrement des configurations des positions dans lesquelles 1 les chats peuvent être mais ce nombre de positions qui sont un peu spéciales est vraiment énorme et donc on signe un ordinateur toutes ses positions ce serait prohibitif et donc ce n'est pas du tout la bonne approche c'est là qu'arrive ces fameux réseaux de neurones alors comment comment fonctionne-t-il d'abord un réseau neurones qu'est ce que c'est un réseau artificiel donc c'est quelque chose qui va exister dans la mémoire d'un ordinateur qui ressemble qu'il ya beaucoup de ressemblances avec la façon dont fonctionne ainsi l'humain on a des neurones qui sont connectés les uns les autres on a une couche d'entrée qui va donc prendre la valeur des pixels d'une image par exemple voilà une couche de sortie qui va nous dire si c'est un cercle ou si ce n'est pas un cercle dans ce cas là et au milieu on va avoir ce qui s'appelle une couche cacher une couche pour lesquels les neurones vont être connectés de tout un tas de façons possibles et on va laisser à la machine elle-même le choix de faire ces connexions donc ses connexions elles sont faites en faisant des pondérations interne donc la machine va essayer de trouver des nombres qui vont donc pondérer ces connexions qui vont faire certaines connexions vont être plus fortes que d'autres est ce qu'on va faire c'est qu'on va montrer à la machine un cercle on va commencer avec des pondérations aléatoire on va lui dire voilà un cercle et donc on va dire la machine trouve moins les pondérations qui font que entre l'entrée et la sortie je vais pouvoir dire qu' un cercle pour les pixels donné on va faire ça pour un premier cercle on fait ça pour un deuxième cercle qui va être légèrement différent on va dire à la machine adaptée pondération pour que pour les deux images précédentes à chaque fois on dise oui et un cercle oui il ya un cercle et on va faire ça pour tout un tas d'image avec des déformations différentes et à chaque fois donc on va dire à la machine va lui demander d'ajuster ses pondération donc c'est configuration interne de ses réseaux et de ses neurones artificiels pour pouvoir en général être capable d'avoir la bonne réponse donc d'une certaine façon en fait on écrit un programme informatique qui permet à la machine elle-même décrire son propre programme de façon interne et donc la façon dont elle va écrire ce programme ça va être de trouver toutes ces pondération des réseaux de neurones interne et en faisant ça en fait la machine tout seul va faire beaucoup mieux que nous elle va être capable de comprendre comment conserver les variations qui sont informatif donc toutes ces données d'entrée et comment ignorer la variation qui ne sont pas un saint formative pour savoir si oui ou non c'est un cercle en sortie en fait la machine va faire ça beaucoup mieux que nous elle va créer son propre langage interne qui va lui permettre de faire ça et d'avoir la bonne réponse et pour faire ça il faut l'entraîné sur tout un tas de données et pendant cet entraînement elle va se reconfigurer en interne pour créer ce langage qui va lui permettre de résoudre la tâche donnée dans les années 90 début des années 90 sa technologie a été développée il ya d'ailleurs un français yann lequin qui est derrière ça qui a été un des des auteurs clé de cette technologie qui a permis de reconnaître donc les chiffres écrits à la main et vous avez peut-être vous vous souvenez peut-être dans les années 90 sont apparus les petites cases sur les enveloppes de la poste pour écrire les codes postaux et en fait donc c'est un les chiffres écrit est élu ensuite par un réseau de neurones de ce type là est le réseau était capable de savoir quels chiffres et des écrits et donc de retrouver le code postal même chose pour les shaks la valeur numérique d'échec est élu par des réseaux neurones dans les années 90 donc ça c'était très bien mais le problème c'est que ça ne marchait qu'avec les choses relativement simples auxquelles et j'en étais capable de créer que des réseaux relativement petit si maintenant on passe à des images qui sont de ce type qui sont plus complexes ces petits réseaux ne fonctionnait pas du tout et on était incapable de faire des réseaux plus gros vous pouvez créer un réseau plus gros dans un ordinateur nous ne savait pas comment faire l'apprentissage de l'ordinateur en regardant plusieurs images ne fonctionnait pas le problème à résoudre était d'une certaine façon trop important et on n'avait pas du tout la bonne approche non ce qui s'est passé c'est que au cours des années 90 après cet enthousiasme pour les chiffres étant donné que les réseaux neuraux ne fonctionnait pas pour des images comme ça qui sont des images qui restent assez petit la communauté a abandonné les réseaux de neurones la majorité des scientifiques se sont arrêtés de travailler sur ce sujet et tout le monde pensait que les réseaux neuronaux tech seulement capables de créer de d'analysé des choses aussi simples que les chiffres mais que ces réseaux seraient incapables d'analyser des images comme celles ci une des raisons pour lesquelles c'était le cas c'est que si on essaie d'avoir une inspiration mathématiques sur la façon dont le réseau fonctionne en fait les idées qu'ils avaient à l'époque allait dans le sens contraire et disait qu'en fait le taux n'a pas d'argument mathématiques qui disait que ce serait peine perdue d'essayer de l'utilité des réseaux de neurones pour attaquer ce genre d'image ok on pensait pas les choses comme il fallait à ce moment là donc les eaux les raisons ont été abandonnés par la communauté et ça a duré des années ok de 2002 1990 jusqu'à 2000 est-ce donc fin des années 90 les réseaux sont abandonnés et ensuite on a des années pendant lesquelles la communauté scientifique mathématiques informatique etc utilisent d'autres techniques ce qui est intéressant c'est que au final tout le monde veut reconnaître les objets dans les images c'est vraiment quelque chose qui est très important nous ont fait ça sans y penser et ce serait fantastique d'avoir des algorithmes qui permet de le faire donc avec tout un tas de challenge qui ont motivé les scientifiques à entrer en compétition les uns contre les autres à développer les techniques les plus puissantes 1 pour arriver à reconnaître des objets dans les images un challenge qui m'attend entré dans l'histoire c'est celui qui correspond aux dates à cette cool qui s'appelle rima jean est il s'agit d'un million d'image et 2000 catégories différentes et donc le jeu pour chaque image c'est une petite image qui fait juste 200 pixels de côté en gros la question c'est quel un quai cale catégorie à quelle catégorie elle appartient ok ça n'est pas aussi facile que ça semble l'être parce que par exemple quand on voit une image de chiens ils vont pas seulement dire c'est un chien mais il faut aussi donner la race du chien ok donc il ya quand même une certaine précision quand on voit une plante il faut dire quel type de plante il s'agit de hockey c'est pour ça qu'il ya 1000 catégorie donc si on regarde ce qui se passe on est dans les années 2010 2011 toute la communauté s'attaque à ce challenge et au cours des années donc les gens développent des techniques différentes et d'année en année il gagne quelques pourcents 1 il s'améliore en termes de performances et ce qu'on voit c'est que quand on est dans les années en 2010 l'erreur est de 25% en gros ce qui veut dire qu'une fois sur quatre l'algorithme ne se plante complètement le reste du temps il arrive à reconnaître ce cas sur l'image ok donc c'est quand même déjà pas mal et ça ça vient après des années de recherches et ce qui se passe c'est qu'il ya un petit groupe 1 de chercheurs dont fait toujours parti jan lequin qui n'a pas abandonné les idées des réseaux de neurones qui a continué à travailler pendant toutes ces années donc là on est quasiment vingt ans plus tard ils ont une période difficile période pendant laquelle il a essayé publié les papiers les leurs papiers été rejetée parce que les gens pour c'est que ça ne marchera jamais mais ils ont ils ont persisté et ce qui se passe quand on arrive en 2012 c'est qu'ils ont enfin compris comment faire pour construire des réseaux plus gros et comment les entraîner et là il ya quelques idées clés qui sont apparues il s'agit d'introduire la convolution une opération mathématique de l'introduire directement dans le réseau une autre idée c'est de s'arrêter c'est ce qui s'appelle la bac propagation c'est à dire qu'on va utiliser le réseau pas seulement dans un sens des inputs de l'entrée vers la sortie l'on peut aussi l'utiliser dans l'autre sens de la sortie vers l'entrée à gaza c'est qui ça a été une idée clef qui a changé les choses et il ya aussi un l'apparition des cartes graphiques gpu qui à la base ont été créés pour les jeux vidéo il s'avère que le type de calcul pour lesquelles ces cartes graphiques sont très performantes et en gros traits semblables au type de calcul dont on a besoin pour entraîner les réseaux neuraux donc la combinaison de tout tout ces éléments ces nouvelles idées plus ses cartes graphiques qui ont permis d'accélérer les choses ont fait qu'en 2012 ce groupe 1 a réussi à utiliser un réseau de neurones a participé à la coupe la compétition et boum ils ont un résultat qui est nettement meilleur que tout ce qui avait été fait les années auparavant et là il faut bien garder en tête que d'année en année le progrès n'était que de 1 ou 2 % à chaque fois et tout d'un coup entre 2011 et 2012 on a 10% 1 d'amélioration ça correspondrait à des années de recherche de toute la communauté scientifique hélas à cette amélioration elle vient juste d'un seul groupe qui a utilisé les réseaux de neurones alors que tout le monde les avait délaissé depuis des années donc du coup tout le monde ouvre les yeux sur les réseaux de neurones tout le monde commence à comprendre comment comment ils fonctionnent et réalise qu en fait on peut créer maintenant on a les moyens on allait à la compréhension qu'il faut pour créer des réseaux de plus en plus gros et donc de plus en plus performants ce qui va se passer les années d'après c'est que tout le monde abandonne toutes les autres techniques toute la communauté mondiale n'utilise que des réseaux de neurones à partir de 2012 et comme vous pouvez le voir au cours des années les réseaux deviennent de plus en plus gros la performance de deviens meilleur et le meilleur et au final on arrive à une une erreur qui est de l'ordre juste de quelques pourcents ok ce qu'on voit sur ce graphique ici aussi c'est l'erreur humaine qui à peu près de 5% vous pouvez dire comment ça se fait que l'erreur humaine soit 2 5% a pas de zéro et comme je vous l'avais dit tout à l'heure il s'agit pas juste de dire il ya un chien sur une image mais faut aussi décrire la race du chien ok donc c'est pas toujours évident ce genre de questions un pari pour les plantes les fleurs etc donc c'est pour ça qu'en moyenne sur ce type de questions les humains ont un taux d'erreur de 5 % très bien donc ce qu'on a vu c'est que ces réseaux de neurones sont capables de faire des choses assez incroyables et maintenant on sait comment construire des réseaux de plus en plus gros et donc on va être capable de créer des réseaux qui vont avoir des millions de neurones voire plus pour vous mais c'est un petit peu en perspective on peut comparer le nom de on peut comparer ça au nombre de deux neurones qu'on trouve dans des cerveaux biologique ok on peut commencer avec les humains ok les humains ont à peu près 100 milliards de neurones dans le cerveau vous avez 100 milliards de neurones dans le cerveau en tout cas j'espère 100 milliards c'est à peu près le nombre des toiles qui a dans la galaxie ok il ya une analogie à c'est assez joli ici et comme vous le voir donc suivant l'espèce qu'on considère donc on a toute une gamme possible un de nombre de neurones dans le cerveau gras je voudrais quand même dire que la comparaison du nombre de neurones dans les réseaux artificielle énorme de rôles dans les réseaux biologique elle n'est pas direct il faut juste c'est juste pour vous montrer qu' on est capable aujourd'hui de construire des réseaux qui commence à atteindre les niveaux qu'on trouve dans le monde biologique ok mais ensuite ce que veut être capable de faire un réseau va dépendre de type d'architecturé donc ça veut pas dire si c'est pas parce qu'on a exactement le même nombre de neurones qu'on va être capable de faire les mêmes choses mais on commence à entrer dans un régime vraiment intéressant ou pour les réseaux artificielle on a des millions voir maintenant même des milliards de neurones donc on va pouvoir faire des choses fantastiques avec voici un exemple on prend un de ses gros neurones raisonnée rhône on va lui montrer tout un tas d'image de visages de personnes le neurone le réseau neurones va former sa représentation interne en changeant tous ces configurations de poids il va avoir sa façon de reconnaître les visages qui va être assez mystérieuse on la comprend pas très bien mais on sait qu'il y arrive qu'à l'intérieur il a cette compréhension de toutes deux de la zone possible qui correspond au visage humain ce qu'on peut faire maintenant c'est on peut se déplacer on peut se balader dans cette zone de représentation et on peut aller chercher les points aléatoire par exemple on peut se placer sur un point aléatoire et on peut dire au réseau ok pour cette représentation qui ne correspond à aucun humain aucune photo réelle maintenant génèrent moins créer une photo qui correspond à cette représentation donc ce qu'on va pouvoir faire c'est utiliser le réseau dans l'autre sens on va partir de cette représentation on va pouvoir générer une image et voici une image qui a été générée par un réseau de neurones d'une personne qui n'existe pas c'est vraiment très réaliste aujourd'hui on a atteint un niveau qui est qui est assez remarquable si vous voulez vous amuser avec ça il ya un site web qui est assez amusant qui s'appelle vise personne does not exist point com ok cette personne n'existe pas vous pouvez y aller et à chaque fois que vous arrivez sur cette page vous verrez la photo de quelqu'un qui n'existe pas c'est assez bluffant et si vous appuyez sur reload recharger la page à chaque fois vous verrez un nouvel individu est cette personne n'existe pas et à chaque fois que vous voyez une nouvelle photo la photo précédente de la personne précédente a disparu à tout jamais donc on est arrivé à un niveau d'expressivité de fidélité qui est assez remarquable on peut maintenant retourner en sciences et se demander ce qu'on peut faire avec donc si vous vous souvenez les techniques d'analysé en astrophysique nom de domaine scientifique comme je vous l'aï dit tout à l'heure l'utiliser méthode statistique qui date d'un certain nombre d'années qu'ils n'ont pas beaucoup évolué avec le temps maintenant qu'on a ces nouveaux outils dans les mains on peut essayer de voir ce qu'on peut faire avec dans un cas comme ça ce qu'on peut faire maintenant c'est voulu d'utiliser ces fameux langage classique un de maths et de statistiques on va utiliser un réseau de neurones pour essayer de représenter cette image de façon interne est de créer de nouvelles images et comme vous pouvez le voir sur cet exemple on est arrivé à un niveau de fidéliser maintenant qui est absolument fantastique donc on sait que quand on utilise un réseau comme ça dans le réseau on a réussi à extraire toute l'information qui nous intéresse pour cette image ok donc c'est une très bonne nouvelle ça va nous permettre de faire tout un tas de choses en sciences et ailleurs alors avant de vous parler d'un plus d'astrophysique 1 cette nouvelle elle est très bonne ok maintenant on a des outils qui sont super puissant il faut quand même faire attention parce que quand le réseau arrive à créer sa représentation interne par exemple ici le problème c'est que on a du mal à savoir comment il a appris qu est ce qu il a appris vraiment ok on essaye d'ouvrir la boîte est de voir à l'intérieur toutes ses configurations du rhône mais d'une certaine façon le réseau neurones a développé un langage qui nous reste assez mystérieux vous n'arrive pas à parler ce langage dont on a du mal à savoir vraiment ce que le réseau a appris comment il a appris et c'est donc il faut faire un petit peu attention et on peut se poser la question de savoir comment est ce que le réseau voient le monde donc je vais démarrer avec un exemple très simple voici l'image de l'ours un réseau a été entraîné à reconnaître des idées à des images d'animaux il nous dit tout de suite c'est l'image d'un os maintenant si je prends une autre image où je vais prendre différentes parties de l'image je vais les déplacés pour avoir une image comme celle ci si je montre cette image au réseau sans hésiter une glisse et images de noces là aucun problème pour reconnaître qu'à la base il y avait en effet un ours sur cette image mais que tout un tout tout tout un tas de parties différentes de cette image ont été déplacées de façon aléatoire pour un humain ce genre de tâche est beaucoup plus difficile qu'il ya tout un tas d'image pour lesquelles si on fait ce réajustement des parties de l'image on devient incapable on n'est plus capable de reconnaître ce qu'il ya sur l'image alors que le réseau de neurones a aucun problème ok ça ça nous dit qu'en fait ils voient les choses de façon un peu différente il ya un autre exemple qui l'opposé c'est celui ci si on dessine juste la forme d'un ours pour un humain il ya aucun problème pour savoir cette annonce mais le réseau neurones et complètement perdus il est incapable de savoir qu'il s'agit d'un ours donc ces exemples sont là pour nous montrer qu' il faut faire attention le réseau a réussi à apprendre à faire tout un tas de tout un tas de choses mais ils voient le monde d'une façon qui par la même que la nôtre et comme c'est indiqué sur ses slides en fait la balance entre la tension qui mise sur la forme ou sur la texture et les détails et pas forcément la même que la nôtre ok en tant qu'humain si on voit une forme générale sans avoir les détails on est capable de reconnaître de quoi il s'agit mais le réseau est perdu et dans le cas contraire si on voit que des détails on a détruit la forme générale en faisant ce déplacement de toutes les parties de l'image le réseau nac aucun problème mais pour nous c'est beaucoup plus difficile donc on voit que le réseau a réussi à créer son langage interne propre à lui même mais ce langage c'est pas forcément le même que le nôtre c'est pas la même il voit pas le monde de la même façon que nous donc y avoir tout un tas de problèmes possibles il va falloir être faire très attention quand on utilise ces réseaux dans des applications scientifiques ou autres un carillon pas tout le temps se comporter de la même façon que nous voici un autre exemple où on utilise un réseau qui détecte des personnes là sur des images donc là il voit bien qu'il ya des individus dans l'image mais voici un tee shirt qui permet de devenir invisible aux réseaux de neurones ok il suffit de porter ce t-shirt que vous pouvez acheter en ligne sur internet si vous voulez et des comporte ce t-shirt sur soi on devient invisible au réseau noc et donc ça veut dire que la façon dont le réseau de rhône comprend cette image est très différente de la nôtre pour résumer tout ça voici une photo qui montre bien les choses ok on à l'individu qui en premier plan qui n'échappe à personne à aucun d'entre nous mais pour le réseau de neurones un cette personne n'est complètement invisible ok donc une fois de plus pour faire attention ils voient les choses de façon différente ok petit résumé de là où on en est aujourd'hui avec ces réseaux il ya eu beaucoup d'avancées je voudrais juste rappeler donc certains points clés donc cette architecture en réseau en couches elle permet au réseau d'avoir des représentations stable du monde par stable ici je veux dire que si on perturbe les choses un petit peu si on a tout cédé formation possible ça va pas changer la réponse du réseau ok c'est vraiment une propriété qui est essentielle si on veut s'attaquer à des dans des complexes à des objets du monde réel et en fait cette cette capacité d'être cette stabilité en fait c'est vraiment ça qui va nous permettre d'ouvrir la porte un monde beaucoup plus complexe quand il s'agit d' analyse de données je vais montrer juste quelques aspects un peu plus technique juste pour un slide ici mathématiquement on a commencé à comprendre comment fonctionnent les choses maintenant voilà le des données peuvent être sur différents domaines on peut avoir des données sur une grille c'est le cas d'une image quand on a une image pixelisée donc les valeurs sont sur une grille si j'enregistre du sont pareils leçon va être enregistrées il a été échantillonnée toutes les 40 millisecondes en gros ça va aussi être sur une grille qui va être en une dimension on peut avoir des données sur la sphère vous pouvez avoir des données de type réseau un réseau social par exemple c'est un type de données différents on peut avoir des données qui sont sur des variétés ou manifold en anglais qui va distribuer sur des surfaces avec des géométries diverses pour différents types de domaine on peut avoir des symétries associés symétrie de translation de rotation de permutations et c est donc tout tout tout cette compréhension mathématiques et théorique est en train d'émerger et donc suivant le type de données suivant le type de domaine sur lequel les données sont distribués maintenant on a tout un tas d'architecturé différentes il ya un zoo en architecture qui existe dans la littérature donc ce sont des technologies 1 qui sont basés sur le même principe mais qui donne lieu à des architectures différentes qui dépendent de la nature des données ok nous tous a maintenant on commence à beaucoup mieux le comprendre et donc ça il s'agit de recherche intéressante donc très bien un bonne nouvelle on a cette nouvelle technologie voyons voir ce qu'on peut faire avec en astrophysique comme je voulais dit ces réseaux neuronaux nous permettent d'aller un étudier des choses qui sont plus complexes donc on va pouvoir se déplacer le long de cet axe de complexité on va pouvoir extraire de plus en plus d'information on ne va plus être limité aux objets qui sont relativement simples qui sont à gauche deuxième comme un exemple un très important en astrophysique c'est la classification des galaxies si on veut étudier la galaxie on peut pas tout les mettre dans le même sac et des galaxies spirales des galaxies elliptiques t galaxies spirales barrées des galaxies font des noyaux d'autres qui n'ont pas si on veut comprendre la formation et l'évolution des galaxies il va falloir séparer les différents types de galaxy pour faire sa com et comme maintenant vous pouvez le comprendre 1 quand on a des idées des images de galaxies comme ça être capable de séparer les spirales les et les petits que les spirales barrées et c'est en fait est quelque chose qui n'est pas si évident que ça dans les années 2000 jusqu'à 2010 on n'avait pas d'outils statistiques informatique on n'avait pas le langage qu'il fallait pour pouvoir résoudre ces problèmes regarde simplement de classe et de séparer les différents types de galaxies on a l'impression qu'on peut le faire à la une comme ça mais comme je voulais dit on a des millions de galaxy donc il faut faire ça de façon automatique sur l'ordinateur et on ne savait pas le faire donc la réponse à la façon dont cet effet à ce moment là si on retourne vers les années 2010 on a fait appel au citizen scientist donc des scientifiques citoyens et donc l'idée c'était de de collaborer avec le public le grand public est de demander à des milliers de personnes 1 2 classes et des galaxies à l'aller sur leur ordinateur chez elle est en fait en rassemblant je ne sais pas combien de milliers ou de dizaines ou de centaines de milliers de personnes tout autour du monde les astrophysiciens ont réussi un pouvoir classifiés quelque chose qui est de l'ordre du million de galaxies aujourd'hui et donc ça a permis ensuite de faire tout un tas d analyse astrophysique les choses ont changé on est capable de reconnaître m'attend des chiens et des chats sur des images on est capable de reconnaître les galaxies spirales des galaxies elliptiques des autres types maintenant il suffit d'appuyer sur un bouton on peut ordonner toutes ces galaxies directement en utilisant des réseaux de neurones et ce qu'on voit un c'est qu'on peut maintenant agent cece galaxy de façon continue et on peut séparer donc différents types différentes classes qui vont ensuite servir de point de départ à tout un tas d analyse astrophysique ok donc là ce que je vous montre c'est une partie minuscule des données auxquelles vous pourriez dire ok je pourrais le faire à l'onu voici une partie maintenant qui très petit de toutes les données toutes les données qu'on est en astronomie serait beaucoup plus grande que l'écran avec et j'ai ici est donc maintenant ce qui est bien c'est qu'on a c'est de cette façon automatique de trier les images et ce qui est très intéressant c'est que étant donné qu'on a une quantité énorme de données ça nous permet maintenant d'aller chercher des objets particuliers au québec d'une certaine façon on peut trouver une aiguille ou les aiguilles dans la botte de foin si on regarde le périph et le pourtour de cette distribution ok on a des galaxies qui sont moins similaire que les autres c'est comme ça que ces agences et est en fait ce qu'on peut faire c'est qu'on peut les regarder une par une et on voit tout un tas d'objets très intéressant ok des objets inhabituels alors on va trouver de tout on va trouver des uns des images pour lesquelles si vous voyez là les segments un vert au rouge qui traverse l'image ça il s'agit de satellites qui sont passés devant la galaxie justement la photo a été prise on va trouver tout un tas de choses intéressantes un des compagnons intéressant des morphologies intéressante est en fête regardez ces objets particuliers qu'on peut maintenant détecter de façon automatique va être un point de départ fantastique à tout un tas d'études astrophysique parce que beaucoup de ces objets ou des choses très intéressantes à nous dire sur les propriétés des galaxies voici un exemple d'application ou les réseaux neuronaux vraiment changer les choses je vous en montrer un autre il s'agit maintenant du domaine de la cosmologie ce que vous voyez ici c'est basé à partir de données réelles c'est la distribution de galaxies qu'on observe dans l'univers ici nous on est à gauche ok et depuis notre galaxie quand on regarde au fin fond l'univers voici toute la distribution de galaxies qu'on observe elles sont 1 visualisez visualiser ici avec leurs couleurs un trailer cool la couleur apparente qu'on voit sur les images ok donc les galaxies qui sont proches de nous apparaissent bleus legacy qui sont plus loin paraissent plus rouge ok attend ce que je veux faire c'est que je vais faire un zoom out de tout ça alors oui peut-être aussi dire que chaque point de cette image c'est une galaxie qui aurait à peu près ce genre de tête donc pour chaque galaxie on a une image et on a un spectre aussi et c'est à partir du spectre qu'on est capable d'estimer la distance de la galaxie donc ça nous permet d'avoir la distribution en 3d de ces galaxies autour de nous ok donc ça c'est une toute partie de l'univers hockey qui est qui proche de nous ce que je peux vous montrer maintenant c'est la carte complète de l'univers quasi complète ok ce que vous voyez ici pareil ce sont des vraies données qui viennent du sloan digital sky survey on est tout en bas de cette image est ce que vous voyez c'est la distribution de toutes les galaxies qu'on observe jusqu'à la limite qui est tous là haut qui correspond au premier flash de lumière le fond diffus cosmologique qui remonte un instant un court après le big bang donc ça cette carte a été obtenue il a fait 15 ans d'observation du ciel pour collecter des millions de galaxy qui nous permet de faire cette carte qui est en 3d là je peux simplement vous montrer une coupe de cette carte je peux pas tout vous montrer d'un coup mais ce que je vais pouvoir vous montrer pour que vous puissiez mieux comprendre cette carte en fait ça va être un film qui va nous faire voyager depuis là où nous sommes jusqu'aux dernières couches invisible de l'univers ok donc ce qu'on va faire c'est qu'on va observer tout le ciel qu'on peut voir à l'oeil nu et on va voir les couches qui vont être de plus en plus profond du ciel et on va traverser tout l'univers comme ceci alors je vais vous montrer ceci voilà tout le ciel qu'on pourrait voir à l'oeil nu ok donc là il s'agit d'un angle de 90 degrés vous pouvez peut-être connaître certaines constellation sur cette image est en fait maintenant ce qu'on va faire c'est qu'on imaginait qu on ait des yeux super sensible et on va aller voir les couches successives de l'univers qui vont être de plus en plus profondes et voilà ce qu'on observe donc maintenant chaque point c'est une galaxie avec sa propre couleur d'envoi les galaxies qui sont très proches de nous et ce qu'on fait c'est qu'on observe l'univers à des profondeurs de plus en plus importante ce qu'on observe ici c'est tout ce réseau filamentaire de galaxies ces amas de galaxies qui sont l'intersection de ces filaments on voit les galaxies avec les couleurs qu'elles ont sur les images c'est toujours magnifique de voir de voir ce film ce conte maintenant ce qui se passe c'est que les galaxies au départ était bleu maintenant il devient de plus en plus jaune parce qu'on observe univers à des distances qui sont de plus en plus lointaine donc on est moins on voit moins les galaxies spirales qui sont assez faibles on voit de plus en plus ces galaxies elliptiques qui sont beaucoup plus brillantes en moyenne donc c'est pour ça qu'on a cette transition vers le jeu il est difficile d'observer les galaxies spirales donc si on continue d'observer l'univers à des profondeurs de plus en plus importante maintenant ce qui va se passer c'est qu'en fait ces galaxies les types jaune elles vont commencer à apparaître de plus en plus rouge est en fait ce qui se passe là c'est qu'on voit l'effet doppler le décalage vers le rouge qui est due à l'expansion de l'univers et maintenant tout devient rouge ce qu'on voit ici se sont plaints de galaxies elliptiques qui sont intrinsèquement jaune mais l'étirement de la longueur d'onde due à l'expansion de l'univers en fait les fait apparaître rouge pour nous donc continuer à observer l'univers à des profondeurs de plus en plus importante on va arriver bientôt un régime où les galaxies sont trop faibles on ne les voit plus avec ce télescope est ce qu'ils restent tous ces petits points lumineux vous voyez ce sont des coizard est donc là il s'agit de trous noirs supermassifs qui sont au centre de galaxies et qui lorsqu'ils à crête de la matière deviennent extrêmement brillant on peut les voir de l'autre côté de l'univers est donc ce qu'on voit ici ce sont en fait c'est quoi there qui sont au centre de certaines galaxies ils émettent de la lumière qui est plutôt bleu c'est ce que vous voyez ici c'est pour ça que on a cette transition vers le bleu à nouveau pour ceux qui un connaissaient les détails techniques on va arriver bientôt un redshift 2 dans l'univers et en termes de 1 remonte en même temps dans le temps on est à peu près à 10 11 milliards d'années il y a dix ou onze milliards d'années dans le dans le passé on voit les kwasa repart tout ici est en fait si on continue à observer l'univers de plus en plus profond le même effet de décalage vers le rouge l'effet doppler va s'appliquer aux coizard et leur lumière bleue va devenir de moins en moins bleu est de plus en plus rouge et c'est ce qui est en train de se passer ici à cette transition on l'a on est quasiment aux confins de l'univers il est très très difficile d'observer tous ces objets ils sont extrêmement faibles et on arrive dans un régime où on ne voit plus rien ce qui s'appelle jack et jill et c'est une période de l'univers où les photons visibles ne peuvent pas nous atteindre aujourd'hui complètement obscur mais si on change de longueur d'onde et on passe en ondes radio on peut observer à ce moment là le fond diffus cosmologique donc c'est une photo un nouveau on va devrait donner c'est le premier flash de lumière qui a été émise dans l'univers juste après le big bang donc j'espère que ça vous a plu et j'espère que ce film vous a permis de mieux comprendre cette carte de l'univers que je vous ai montré hockey au cours de ce film ce qu'on a fait ça qu'on s'est déplacé du bas on a regardé des couches successives jusqu'à 1 la première lumière le fond diffus cosmologique donc si on revient vers l'univers proche et si on zoome sur la distribution de galaxies maintenant donc j'imagine que vous avez une meilleure idée de ce à quoi ça correspond un quand on regarde ce genre de données en fait et on essaie de décrire ce qu'on voit on est dans le régime ont fait de la cosmologie on s'intéresse pas une galaxie où quelques galaxies on s'intéresse à l'univers dans son ensemble et donc on voudrait essayer de décrire toute cette distribution et j'espère que ça vous rappelle le mot clé que j'avais utilisé au début donc il s'agit de caractériser la texture de l'univers d'une certaine façon c'est un peu ça qu'on veut faire de temps en temps quand on fait de la cosmologie ses caisses que ce qu'est ce que la texture de l'univers quelle est la densité de l'univers 1 à quoi ressemble cette fluctuation convoi qui sont dus au fait qu'il ya des endroits où il ya plus de galaxy que d'autres 1 quels sont ses amplitudes de fluctuation quelles sont ses formes et c'est donc tout ça sont des questions que l'on qu'on aimerait poser on à y répondre de façon quantitative et donc il s'agit de caractériser la texture de l'univers et comme je voulais dit tout à l'heure on a maintenant grâce à ces fameux réseaux de neurones on est des moyens beaucoup plus puissant un d'attaquer ces questions et donc la bonne nouvelle c'est qu'on va pouvoir enfin utiliser toute l'information au quasiment toute l'information un des données qui nous viennent de tous est un télescope qui sont au sol ou qui sont dans l'espace pour lesquelles on a dépensé des ressources des moyens considérables et en fait ce qui s'est passé au cours des années c'est que maintenant grâce à ces nouveaux à ce nouveau langage statistique et informatique en fait on obtient une vision de plus en plus précise de plus en plus riche des données qu'on a réussi à observer ok on n'a plus cette cet effet limitant qui était dû à un espace d'entonnoir qu'on avait avant un qui était dû aux autistes statistiques ont utilisé ok on a un nouveau langage qui maintenant permet d'extraire toute l'information dont on a besoin le prix à payer pour ça c'est qu'on extrait plus juste un ou deux coefficient pour mesurer les choses maintenant le prix à payer c'est qu'il faut manipuler des objets qu'ils ont beaucoup plus gros auquel ces réseaux neurones comme je vous ai dit peuvent avoir des tailles qui grandissent énormément et au final l'information l'a compris le langage du réseau de neurones il va être encodé 1 dans toute une série de coefficient 10000 confiance en mes coefficient millions et est maintenant le problème c'est qu'ils te voilà que veut dire ces coefficients comment les interpréter c'est vraiment là maintenant ou 1 où se joue un oui tout l'enjeu très bien j'espère que je vous ai convaincus qui est donc il va se passer tout un tas de choses très intéressantes en astronomie ok cette intelligence artificielle ses réseaux de neurones se machine learning maintenant nous permettre d'extraire beaucoup plus d'informations en fait ce que je voudrais vous montrer c'est que 1 il va se passer des choses fantastiques mais essayons de regarder une image un petit peu plus générale avec toutes les disciplines scientifiques et si on les compare est un petit peu alors pour mettre tout ça en perspective on a essayé de penser les choses de la façon suivante mon axe dx ici je vais mettre des choses qui sont complètement ordonné à gauche est complètement désordonnée à droite donc à gauche il s'agira par exemple de cristaux hockey de structures qui sont complètement ordonné qu'ils ont complètement régulière et à droite il s'agit de gas de placement ou de liquide si vous voulez ça sont des objets typiques qu'on trouve en physique en astrophysique maintenance et de ces objets parmi tout ce qui est possible dans la nature reste assez simple ok ils ont une certaine complexité mais si on met les choses en perspective il reste plus simple que d'autres objets qu'on trouve dans d'autres types de domaine par exemple si on observe la surface de la terre vue de satellites on a une complexité qui est beaucoup plus importante donc si on regarde ce genre d'image il ya beaucoup plus de variabilité beaucoup plus de richesses que les images qu'on trouve en astronomie et si on continue si on s'intéresse maintenant au monde biologique elle trouve une compétence une complexité énorme qui quasiment sans limite ok et ce genre d'objet se situe à l'interface entre le monde ordonné et le monde désordonnée donc différentes disciplines scientifiques s'attaque à des types de données qui sont différents et donc s'attaque à des types de complexité qui sont différentes est ce que je voudrais dire c'est qu'en physique un presque par définition on s'intéresse à des objets qui sont relativement simples auxquelles les objets du monde physique les objets qu'on trouve un dans l'univers sont beaucoup beaucoup plus simple que les objets qu'on trouve dans le monde biologique donc les techniques de machine learning les réseaux neurones vont faire des choses pour nous permettre de faire des choses fantastiques en astronomie mais je pense pas qu'il va y avoir une révolution en astronomie hockey parce que comme on peut le voir ici les objets l'étude qu'on a reste à des niveaux de complexité relativement bas par contre dans d'autres domaines ok il s'agit de l'observation de la terre il s'agit du monde biologique il s'agit d'écologie de sociologie de neurosciences etc ou les objets d'étude sont beaucoup plus complexes l'a1 ma prédiction c'est qu'il va y avoir des révolutions qui vont être qu'ils vont être permise grâce aux réseaux neuronaux très bien je vais finir avec les points clés de cette présentation juste les quelques messages que j'aimerais que vous vous souveniez donc on a vu que cette nouvelle technologie est apparu on a commencé à vraiment bien la comprendre créer des réseaux qui peuvent croître en taille sur des ordres de grandeurs ça ça vient de 2012 c'est assez récent les ordinateurs existait depuis bien plus longtemps internet existait depuis bien plus longtemps et c'est donc c'est vraiment une nouvelle technologie qui est apparu qui n'existait pas avant et donc cette technologie nous permet d'aller de manipuler d'analyser de comprendre de générer des objets de plus en plus complexes donc ça c'est fantastique pourquoi est ce qu'on peut faire ça on peut faire ça parce que fondamentalement un set serré zone euro nous permet d'avoir une structure qui donne lieu à un langage qui est stable vis-à-vis des déformations possible c'est vraiment ça la clé dont on avait besoin pour s'attaquer rire des choses de plus en plus complexe et donc du coup on a ces nouveaux outils qui sont extrêmement puissants qui nous permet de faire tout un tas de choses qu'on rêvait de faire avant que maintenant qu'on peut commencer à faire ce qu'il faut dire aussi il faut se souvenir de ça c'est que ces réseaux de neurones créé un langage interne ce langage est écrit dans une langue qui n'est pas la nôtre qui permet de faire des choses très puissante mais ce langage reste assez mystérieux est assez opaque pour nous et beaucoup de gens comparent les réseaux de neurones la des boîtes noires on sait vraiment pas ce qui se passe à l'intérieur comme je vous ai montré ils voient le monde de façon différente de la façon dont nous voyons le monde et donc entendre les utilisent il faut garder en tête tous ces soucis possible ou la question c'est si on à faire des résultats comment est-ce qu'ils vont dépendre de ces façon différente de voir le monde qu'il faut rester un petit peu attentif il faut essayer de comprendre je pense que le vrai challenge maintenant qui est devant nous pour les années à venir c'est d'essayer de décrypter ce langage un terme des réseaux de neurones qui est complètement mystérieux et très souvent je pense que ce qui se passe à l'intérieur des réseaux de neurones est aussi mystérieux qu'est ce qui se passe aux confins de l'univers on voit des choses exotiques comme la matière noire et l'énergie sombre et c'est aujourd'hui on a devant nous des systèmes qu'on a créé nous mêmes et qui font des choses qu'on ne comprend pas complètement avec beaucoup de mystères à l'intérieur donc le challenge pour les années à venir c'est d'essayer de décrypter tout ça je vais m'arrêter ici je vous remercie [Applaudissements] et bah merci beaucoup brice tu m'avais qu'on fait c'est juste avant de parler que tu avais très peu fait présentation en français mais essentiellement en anglais donc en faire une en français c'est un beau challenge un beau défi que tu as parfaitement relevé il y avait quelques slides quelques diapos qui avait un peu d'anglais mais très peu donc merci beaucoup d'avoir fait cet effort est donc alors il ya quelques questions quelques commentaires sur le chat de youtube n'hésitez pas à en faire plus je pense qu'il y aura quelques questions également dans le public je vais passer parmi vous je vais commencer par une question qui était sur youtube quand tu as dit tu as montré l'exemple de l'ours blanc dix ans c'était difficile et réseaux de neurones arrivait pas concéder un dessin où il y avait l'exemple du sweat shirt kaki qui n'étaient pas reconnus par les réseaux de neurones est ce que c est ce que c'est une constante tous les rites toutes ces méthodes là ont les mêmes difficultés avec un dessin ou ne reconnaissent pas un sweat shirt est ce que enfin avec ses 10 ans l'a déjà cette question là et puis est ce que tu pourrais peut-être rentrer un peu plus dans les détails expliquait un petit peu plus pourquoi ce sweat shirt il est difficile à identifier pour la zone alors ok alors ce que je peux commencer par dire c'est que voilà donc ça ça va dépendre du type de réseau et ça va dépendre de ce qu'il a appris pendant sa phase d'apprentissage 1 [Musique] tous les réseaux vont avoir ce jeu pour en voir un certain type de problèmes auxquels le type de problème va dépendre du réseau ce qu'on peut faire c'est que voilà si un incident le troisième quart le réseau n'a pas réussi à comprendre la forme de l'os ce qu'on peut faire c'est qu'on peut lui faire apprendre des formes donc on peut lui donner des nouvelles données avec des justes les formes douces le réseau va se met à apprendre encore plus et donc du coup il sera capable de répondre à ce genre de questions mais bon le problème ne s'arrête pas là parce qu'on pourra toujours trouver des choses des cdd type d'image qui vont induire le réseau en erreur ok on peut même construire de façon mathématique certain type d'image qui on le sait va mettre le réseau en erreur donc il ya cette histoire de d'attac des réseaux où on peut en fait [Musique] on peut design et on peut on peut créer un certain type d'image qui on le sait avant d'hurler réservé ce qu'on peut faire c'est qu'on peut prendre un réseau qui a déjà été entraînés et en fait on peut on peut jouer on peut regarder un petit peu ce qui se passe à l'intérieur et on peut trouver des des régions qui vos collègues qui vont correspondre un certain type d'image qui on le sait vont conduire à des erreurs le problème c'est que c'est une histoire de chat et de la souris ou de deux chicanes bègue c'est à dire que l'on peut le réseau peut toujours apprendre plus donc il peut si on sait qu'il est induit en erreur sur certains types de d'image on peut lui donner plus d'image de ce type pour qu'il fasse pas ce genre d'erreurs mais on pourra toujours trouver un type d'erreur est en fait un petit peu là monsieur la même chose du côté ok on peut toujours c'est le cas des illusions d'optique par exemple ok on a tout un tas d'image qui ont tant qu'humain nous paraissent différente de ce qu'elle peut vraiment être et un en fait ça ça nous dit donc certaines choses sur la façon dont fonctionne le cerveau et on peut apprendre à voir les illusions d'optique de façon différente pour pas être induit en erreur mais il pourra toujours y avoir d'autres types d'illusions qui nous mettraient en qui nous induire en erreur donc on peut contourner ces problèmes mais il ira toujours il ya toujours hélas ce jour des nouveaux problèmes derrière et comme en fait on n'a pas de compréhension globale de ce qui se passe de façon interne dans le réseau de roanne ce fameux langage reste assez mystérieux on peut pas approcher le problème de façon un générique de façon globale qui nous permet de résoudre tous ces problèmes de vulnérabilité des réseaux donc il reste beaucoup à faire dans ce domaine sont des questions qui sont très importantes et qui qui effraie beaucoup de gens quand on sait que les réseaux de neurones sont utilisés 1 pour les voitures qui sont autonomes pour tout un tas pour des décisions médicales par exemple qui sont très importantes détection des cellules cancéreuses par exemple il ya des réseaux neuronaux qui sont utilisés aujourd'hui ainsi il ya quelque chose de bizarre dans l'image qu'un humain reconnaît très directement mais qui induit un réseau en erreur ça peut avoir des conséquences dramatiques donc il ya tout un tas de questions aujourd'hui sur sur les limites et les dangers possibles et le problème c'est qu'on n'a pas de théorie derrière les mathématiques des réseaux de neurones ne sont pas suffisamment matures pour qu'on puisse s'adresser à tout ça merci alors sur un point au moins dramatiques sur le coup du sweat shirt est ce que la moyenne des catcheurs explosif qui est un peu pourquoi il serait avoir très bien alors ma compréhension des choses j'ai pas regardé tout ça dans les détails mais ma compréhension tout simple en regardant cette image ce qui se passait sweat shirt inquiet porté par ce monsieur a en fait dessus une espèce de seine d'avant-plan où on voit ici 1 en fait on voit que c'est comme s'il y avait des gens qui étaient sur sa poitrine ici est en fait le réseau qui a été entraînée sur des images normales n'a jamais vu de situations où des gens sont ici qui paraissent être en arrière-plan alors que devant il ya en fait quelqu'un avec une tête au dessus il n'a jamais vu ce genre de configuration nous en tant qu'humain on reconnaissait directement longs raides le réseau n'a jamais été mis dans ce genre de situation auparavant et en fait ils portent beaucoup plus d'attention sur le tee shirt que sur la tête de ce monsieur est donc une nouveauté voilà ok merci y at il des questions des commentaires dans la salle j'arrive bonsoir est ce que vous êtes en train aussi en train de dire que c'est pas la peine d'augmenter les tailles de réseaux de neurones mais de mieux les exploiter pour ce qui existe de mieux les comprendre alors tout dépend de ce que l'on souhaite faire 6 1 si le but est de regarder des voiles à ce genre d'image par exemple pour analyser ce genre d'image qui sont pas trop grosse pas trop complexe on n'a pas besoin de gros réseaux ok ça s'est fait avec on peut faire ça avec 10000 paramètres 100000 part à 100 milles paramètres quelque chose comme ça on n'a pas besoin de millions de milliards donc il ya déclarations souvent le cas on peut utiliser un réseau qui est relativement petit mais ce qu'on aimerait vraiment dans un cas comme ça même si le réseau est petit c'est d'essayer de comprendre ce que ces 10000 paramètres nous disent pour l'instant on ne sait pas c'est écrit dans une langue mystérieuse qu'on n'arrive pas à décrypter on aimerait beaucoup savoir ce que le réseau a pris 1 mais on n'y a pas accès donc la taille du réseau il nous faut des réseaux de plus en plus gros quand on s'attaque à des uns des objets des images de plus en plus grosse et des objets de plus en plus complexes comme comme les photos qui sont ici qui ne sont pas des photos qui sont générés par des réseaux neurones pour faire ce genre de choses on peut pas faire ça juste avec 10000 paramètres ils en font tout un tas de millions ici donc on est dans un régime qui est plus un plus gros seins mais qui reste relativement petit par rapport à d'autres réseaux qui existent dans le monde dans l'industrie qui manipulent les milliards de paramètres donc la taille du réseau dépend de la complexité de la taille des données qu'on veut qu'on veut manipuler un mais dans tout un tas de quatre scientifiques où on n'a pas à traiter des images qui sont vraiment énormes on est capable d'en tout cas de découper le data 7 dans des petites images sans perte d'informations on peut utiliser des réseaux qui sont beaucoup plus modestes mais dans tous les cas on aimerait beaucoup comprendre ce qui se passe à l'intérieur et c'est très frustrant de savoir que le réseau a été capable de faire des choses on n'arrive pas à faire de façon statistique avec des outils mathématiques classique on aimerait beaucoup savoir comment est ce que le réseau il ya des avancées qui sont faites il ya tout un tas de chercheurs ici à l'école normale de paris qui travaille là dessus avec tout un tas de résultats intéressants mais il reste beaucoup de questions assez fondamental merci peut-être une autre question sur le chat souvent justement par rapport à ces erreurs dont parlait le coût du sweat shirt loose est ce qu'il ya des erreurs similaires comme ça dans les galaxies des exemples que tu as montré les reconnaissances où la machine se fait avoir alors que le human ce trait pas la voir je pense que c'est encore un peu trop tôt à ma connaissance gg pas de comparaisons aussi évidente aussi aussi fortes mais si on regarde les galaxies six ans au hockey si on regarde quand on voit là on a un jeu donné comme ça qui va être énorme avec des millions de galaxy on va commencer à ordonner les galaxies en utilisant des réseaux de neurones on n'a pas encore tout inspecter pour savoir si le réseau a fait du bon boulot partout vous faites ces technologies arrivent en astrophysique avec un certain délai par rapport aux applications qu'ils ont eue dans d'autres domaines donc en fait en astrophysique d'une certaine façon on commence en fait ça fait quelques années déjà mais on commence et on a encore beaucoup à faire dans l'utilisation déraisonnée rhône ain il ya des tests qui ont été faits mais pas suffisamment encore pour vraiment savoir si ça fonctionne tout le temps bien comme on veut on a beaucoup à faire dans cette direction c'est qu'à des problèmes potentiels 1 mais en tout cas à ma connaissance on n'a pas encore identifié un type de problème particulier qui va nous affecter en astrophysique d'accord merci d'autres questions qu'on enterre dans la salle louis c'était tout à fait remarquable j'ai une question tout à fait ponctuel sur un petit détail vous avez montré des synthèses du mode de visage je voudrais savoir ce qu'on met à l'entrée du réseau pour obtenir ce visage alors c'est un réseau qui a simplement été entraînés sur une collection un grand nombre d'image de visages qui sont des images qui viennent d'internet de facebook et autres ce sont des images aléatoire de visages de gens donc c'est la seule entrée qui a dans ce réseau le réseau construit sa représentation interne sa compréhension des images et donc ça c'est encoder avec des millions de paramètres qu'on ne comprend pas très bien mais on sait qu'on peut activer c'est cette région cette représentation on peut se placer dedans on peut activer un certain point dans cette région et ensuite on peut utiliser comme je vous ai montré le réseau dans l'autre sens pour créer un visage donc la seule entrée ce sont juste à la base des images de visages c'est tout le réseau apprend et le réseau construit sa représentation interne son langage interne pour décrire les images et donc une fois qu'on a ce langage on peut l'imaginer quand même espèce de nuages de paramètres ensuite on peut aller à n'importe quel endroit dans ce nuage et on sait que ça va décrire l'image d'un visage humain voilà une autre question je crois car ma question c'était vraiment il ya un nuage et on commet dit au réseau ce jeu choisi ce point du nuage donc si vous allez sur ce site web auquel ce point c'est un point qui était ce qui est décidé de façon complètement aléatoire donc en fait on peut on peut demander autant de l'image qu'on le veut on va dans cet espace on va prendre des points qui sont complètement choisi au hasard et chaque point correspond à une image et en fait on peut même se déplacer on peut avoir une trajectoire on peut se déplacer de façon continue on va avoir une image qui va changer de façon continue on va pouvoir par cette impasse et d'une personne à une personne mais de façon complètement continue vous avez peut-être vu ce genre d'animation et donc voilà ce qu'est ce que nous permettent de faire de faire un réseau donc en fait l'entrée c'est juste des images et après une fois qu'on a cette représentation mais on peut jouer avec et on peut on peut l'explorer et et voir tout ce qui nous permet de faire merci une autre question j'arrive une autre question peut-être sur le tchat sur le comment les astronomes sont ils sensibilisés à l'analyse de ces données la ti de ces données massives prédit géré par l'intelligence artificielle en gros comment ces techniques sont divorcés perçu c'est une question très intéressante à cause des problèmes potentiels dont j'ai parlé et aussi du fait que voilà il s'agit d'une technologie nouvelle comme c'est souvent le cas on a des réponses qui sont très polarisée on a une partie de la communauté qui est très inquiet pas encore convaincus qu'ils voudraient être plutôt un safe et on a une autre partie de la commune éthique est complètement enthousiaste c'est peut-être même trop enthousiaste et qui voudraient utiliser ces réseaux de neurones pour faire presque trop de choses et en fait ce qui se passe c'est que voilà c'est très polarisée c'est devenu très bimodale où on a une partie de la communauté ce qui dépend ce qui se correspondent souvent à des gens qui s'ils devaient décoller qui sont plus seniors qui voit cette nouvelle technique qui arrive un petit peu de nulle part qui ont beaucoup de doutes quant à son efficacité quant à ces dangers potentiels et c'est donc là on voit qu'en fait c'est l'expérience qui joue et qui dit oh faut peut-être pas trop se précipiter et à côté de ça il ya plein de jeunes 1 qui sont très enthousiastes qui veulent apprendre de nouvelles techniques qui savent que ce n'est que le début que savait qu'il va y avoir toute une évolution qui va durer des années et est donc ils utilisent ces réseaux de neurones pour explorer tout un tas de questions en astrophysique donc la réponse la réaction de la communauté où la perception de ces réseaux neurones ça fait pas encore c'est pas tout le monde n'a pas la même la même position vis-à-vis de ces nouvelles techniques mais ce qui est sûr c'est que c'est en évolution extrêmement rapide ça complètement révolutionner tout un tas d'autres domaines et tout un tas d'applications de la vie de tous les jours et je pense que l'on peut en attendre beaucoup en astrophysique comme j'en ai parlé précédemment et je pense que les les réticences de certains très probablement vont s'apaiser avec le temps un plus on va tester ces techniques plus on va démontrer qu'on peut faire des choses intéressantes avec et puis on va obtenir de nouveaux résultats d'autres questions une question de notre directeur est ce que tu pourrais commenter un peu sur le fait qu' il faut apprendre il faut utiliser des millions voire des dizaines de millions de l'image pour apprendre à reconnaître un chat et un enfant lieux montre un chat quatre fois et de leur père alors il n'a pas la même capacité etc mais il ya aussi quelque chose qui nous paraît un peu mystérieux et donc qu'est ce que c'est je suscite comme commentaire tout à fait donc un juste répéter la question résumé la question ulcéré zone euro n'ont besoin de beaucoup d'image pour apprendre alors qu'un enfant va voir un chat un pendant quelques secondes et va être capable de reconnaître d'autres chats directement alors c'est sûr ces deux ces deux situations on dénote des connaissances près acquise qui sont très différentes au quai à un petit enfant a déjà vécu pendant des années il vu beaucoup de choses dans sa vie alors que le réseau neuronal jamais encore rien vu il doit apprendre des formes très basique et commence 2 0 ce qu'on a vu c'est que même si on laisse ces deux systèmes à prendre au final on a des compréhension du monde qui sont très différentes maintenant ce qui se passe avec les réseaux de neurones c'est que ils nous viennent ils ont ce sont des ingénieurs qui les auront construit d'abord et aujourd'hui on a des réseaux de neurones qui fonctionne on n'a pas encore la théorie mathématique derrière qui nous permet de comprendre comment il fonctionne il ya des avancées qui sont faites sur ces dernières années et on sait que ça va continuer encore et en fait mieux on les comprend plus on arrive à améliorer l' architecture de ses réseaux pour avoir besoin de moins en moins de données pour leur entraînement et en fait si on regarde en fonction du temps la taille des données qu'il faut pour entraîner un réseau pour faire une certaines tâches plus ont le temps avance au cours des années en fait n'a besoin de moins en moins de donner parce qu'on comprend ces réseaux de mieux en mieux on est capable d'injecter certaines propriétés directement à l'intérieur du réseau comme des symétries de translation de rotation etc s'ils ont les uns jacques différents directement à l'intérieur du réseau le réseau n'a pas besoin d apprendre et donc du coup au lieu d'avoir besoin d'un million d'imagés il en aura besoin que de dix mille et si on continue à injecter certaines connaissances ou certaines propriétés comme ça à l'intérieur du réseau on peut espérer arriver un régime où il aura besoin d'un très petit nombre d'image pour apprendre qui sera peut-être comparable à l'équivalent humain tout à fait tout à fait et j'en ai pas parlé pendant cette présentation mais en fait un il ya eu beaucoup d' influence de la biologie des neurosciences qui ont permis justement de comprendre comment créer les architectures des réseaux de neurones et en fait ce qu'on peut voir c'est que les les premières couches de ces réseaux de neurones sont très semblables aux premières couches de neurones qu'on a nous dans notre cortex visuel est en fait ces séances avec de l'inspiration qui vient de la biologie qui nous appellent c'est comme ça qu'on a qu'on a pu concevoir ces fameuses couche et on sait qu'en fait ces couches fond des choses très similaires alors aujourd'hui on a cette connaissance que pour les premières couches si on va dans les couches plus profondes on ne sait pas vraiment ce qui se passe dans les réseaux actifs dans les réseaux de neurones artificiels il ya aussi beaucoup de mystère dans ce qui se passe dans le cerveau humain en fait je pense qu'on va voir avec les années qui arrivent c'est qu'on va pouvoir explorer ces deux systèmes dans les couches de plus en plus profondes et avoir des compréhensions beaucoup plus fondamentale de la façon dont ils perçoivent et il y aura peut-être tout un tas d'influencés qui va venir de la biologie qui va faire bénéficier les réseaux de neurones artificiels ou peut-être c'est en étudiant les réseaux de neurones artificiels qu'on va pouvoir faire des découvertes en biologie en neurosciences merci d'autres commentaires sur le chat de youtube qui sont assez classiquement ces questions avec des questions qui se posent ça pose évidemment des questions liées aux cdo aux libertés individuelles au respect de la sphère de la sphère privée etc on est un petit peu en astrophysique évidemment mais c'est quand même les questions qui se posent des commentaires des avis là dessus en tant que spécialiste de ces techniques alors c'est assez générales comme question 1 il y à tout un tas de [Musique] j'avais une question notamment sur les législations en cours législation qui sont bien plus souvent lentes a avancé que les développements technologiques âme quand il s'agit quand quand il ya tout un tas de décisions prises par les décisions médicales des décisions légales prises par les réseaux de neurones ce qu'il faut garder en tête c'est que la réponse donnée par les réseaux neuronaux dépend énormément des données avec lesquels il a été entraîné et donc ce qu'il faut ce qui est très important il ya tout un champ de recherche maintenant qu'ils sauvent là dessus parce que c'est vraiment fondamental c'est s'assurer que dans les données d'apprentissage où on est toutes les représentations dont on a besoin ok ce qu'il s'agisse de race qu'il s'agisse de tout un tas de propriété possible il est important il très important que l'échantillon d'apprentissage soit représentatif de la population sur laquelle on veut appliquer un réseau de neurones pour tout un tas de décisions médicales en fait si on regarde par exemple et les réseaux neurones qui détecte les cellules cancéreuses les tissus humains ne sont pas n'ont pas les mêmes propriétés ils n'apparaissent pas de la même façon exactement sur les images pour des races diverses aux quatre coins du monde et donc si on entraîne un réseau juste sur un certain type de personne on l applique sur un autre type pour fait ça va pas forcément marcher avec la même performance donc il faut s'assurer que dans ces données d'entraînement on est toutes les représentations possible donc voilà vision de questions qui maintenant deviennent très importante parce que ces réseaux sont très vite déployé à très grande échelle il ya tout un tas de réseau qui fonctionne quasiment en permanence sur les smartphones pour tout un tas de décisions les moteurs de recherche utilisent les réseaux de neurones ils sont qu'ils sont partout autour de nous et avec le temps il y en avoir de plus en plus et donc il faut vraiment s'assurer qu'ils soient suffisamment sécurisé suffisamment robuste et qui n'est pas de biais de décisions dans une direction ou dans une autre il ya encore beaucoup de travail à faire dans cette direction merci d'autres commenté aux questions dans la salle oui oui amy question enfin quelque chose qui m'intrigue enfin le mot est un peu simpliste si je vois le site web qui est là haut est-ce que derrière ça j'aboutis sur une sorte de datacenters quelque chose qui je sais pas matériellement commencent à se comment ça se matérialise oui voilà il ya des machines derrière alors je ne connais pas tous les détails de ces 10 passes et ce que j'y suis drôle c'est que maintenant derrière ces sites web c'est juste un ordinateur avec quelques cartes graphiques c'est tout y a pas besoin d'un système monumental c'est quelque chose qui est de ce genre de cet ordre de grandeur est ce qu'il faut dire aussi c'est qu'en fait il ya la phase d'apprentissage est une phase de calcul assez lourde mais une fois que le réseau a appris quand on veut l'utiliser sa part contre voilà il suffit juste d'un téléphone pour l'utiliser j'ai pas besoin d'un gros ordinateur c'est vraiment très rapide et c'est un genre de calcul qui est vraiment très léger donc une fois que l'apprentissage a été fait il peut être fait sur une grosse machine on peut ensuite le donner à n'importe quelle machine de l'installer sur n'importe quelle machine et ça marche et en une fraction de seconde merci d'autres questions commentaires dans la salle oui est ce qu'il ya des sujets de recherche en cosmologie très fin très actuelle est très spécifique qui intéressent et qui attire beaucoup de chercheurs ou alors c'est tout le monde qui cherchent un petit peu dans son coin effet d'exploiter des images et du coup il ya un grand nombre de publications dans plein de directions différentes ok on astrophysique les réseaux de neurones sont utilisés dans toutes tous les tous les champs d'asie d'inde de l'astrophysique dans tous les sous disciplines dont quasiment toutes les sous discipline on trouve maintenant des réseaux neurones [Musique] dans toutes les publications ce que j'ai montré la croissance incroyablement rapide du des publications en astrophysique avec les réseaux de neurones c'est ça concerne quasiment toutes les disciplines de l'astrophysique dès qu'il ya un petit peu de complexité les raisons du rhône vont pouvoir faire des choses à très utile 1 si on regarde la classification des galaxies à des challenge de la même façon qu'ils avaient un challenge avec l'image est nette pour détecter des chats des chiens des voitures dans les images on a des challenges en astronomie on va comparer différentes techniques différents types de réseaux de neurones pour faire cette classification des galaxies donc là au niveau mondial il va y avoir différentes équipes qui vont qui vont entrer en compétition pour voir quelles sont les meilleures techniques en cosmologie ya beaucoup de recherches inquiets qui est en train d'être faites sur un quelles sont les meilleures façons d'extraire l'information cosmologique de toutes ces données où on a des la distribution de millions de galaxy donc ça c'est un champ de recherche qui est très actif à ma connaissance il n'y a pas encore eu de tchatche on a directement tester des réseaux des réseaux de neurones différents et du challenge qui existent avec des outils statistiques différent mais je pense qu'il s'agit juste de il faut attendre très peu de temps pour kilian challenge aussi avec des réseaux de neurones dans ce domaine ça c'est un chant de domaine qui est très très actif une des raisons c'est qu'il ya tout un tas de missions spatiales qui vont bientôt à partir commencé à acquérir des données il ya des gros télescope qui sont construits sur le sol qui vont aussi voir leurs premières lumières très bientôt l'enjeu est énorme les moyens les ressources qui sont mis derrière sont énormes ce sont des centaines de millions d'euros des milliards d'euros donc à la fin être capable d'extraire toute l'information de la meilleure façon possible est un enjeu très très importants et d'une certaine façon la cosmologie c'est ça la cosmologie c'est de prendre toutes les données qu'on a un distribution des galaxies fond diffus cosmologique etc et d'essayer d'en extraire le maximum d'informations possible parce que quand on observe l'univers dans son ensemble nous n'observe qu'un seul univers d'une force et d'une certaine façon c'est assez réduit comme un vu des choses et donc et en os quand on observe qu'un seul on va vraiment l'enjeu c'est d'extraire toute l'information possible donc c'est un sujet de recherche vraiment très actif est exactement 1 il y avait ici juste il ya quelques mois à l'iap et un colloque international sur l'utilisation des réseaux de neurones en astrophysique et beaucoup des présentations qui ont été données lors de ce colloque concernaient des études de cosmologie avec des réseaux de neurones dont qui s'y passe beaucoup de choses eh eh oui tout les toutes ces présentations alors qu'ils sont en anglais pour le coup est très spécialisés sont disponibles sur la chaîne youtube de danse et de théâtre optique de paris on allait conférence générale comme ça mais aussi des conférences plus spécialisés donc les gens qui veulent s'intéresser plus en détail à ces questions évidemment peuvent se reporter sur ce site y at il d'autres questions et commentaires pour finir dans l'amphithéâtre ou sur internet c'est fini la voix peut-être gendre j'en ai peut-être une dernière sur par rapport à la phrase que tu cites et de richard mme fan de richard feynman quant à canotes criait tu as une auto leur stand ce que je ne ferai pas je ne comprends pas et donc pas par rapport à ce que tu as présenté là donc on arrive à recréer des choses avec ces techniques là mais sans toujours bien les comprendre ils sont toujours bien comprendre exactement est ce qui est très frustrant ça qu'on sait que la compréhension elle est là dans ce réseau de neurones qu'on a créé nous mêmes dans cette boîte on le problème c'est qu'elle est écrite dans un langage qu'on ne sait pas décrypté pour l'instant donc la réponse est devant nous 1 il va falloir essayer de comprendre ce que ça veut dire bon bah merci beaucoup vries encore pour cette conférence on a plein de messages des remerciements et ses 40 merci beaucoup encore merci à vous tous deux venus ici ce soir à l'institut d'astrophysique de paris merci à ceux qui nous ont suivis sur sur notre chaîne youtube et donc on se retrouve pour notre prochaine conférence à l'iep et vous pouvez consulter notre programme sur notre site internet voilà merci bonsoir

Transcript for:Astrophysique et Intelligence Artificielle - Brice Ménard

Transcript for:
Astrophysique et Intelligence Artificielle - Brice Ménard