L’un des meilleurs joueurs de Go du monde, Lee Se-dol, a pris sa retraite en Novembre 2019. La raison ? AlphaGo, une intelligence artificielle, développée par une équipe de Google l’a battu lors d’un match en 2016. Le joueur motive sa décision d’abandonner la compétition « L’IA ne peut être vaincue ». Mais alors, qu’est-ce que la machine a de plus que l’homme qui peut la rendre imbattable dans certains domaines ?
Originaire de Chine, le GO est un jeu de plateau opposant deux adversaires. Les joueurs doivent chacun leurs tours déposer une pierre noire ou blanche sur les intersections du plateau composé de 19 intersections sur 19. Le but ? Encercler des territoires pour marquer un maximum de point. « C’est un jeu d’encerclement et de partage parce qu’on ne peut pas toujours tout avoir, il faut savoir partager avec son adversaire et réussir à avoir la plus grande part du gâteau à la fin » explique Benjamin Dréan-Guénaïzia, élu champion de France de GO avec un premier titre en 2017 et un autre, fin 2019.
Alors qu’il y a plus de 20 ans le champion des échecs Kasparov perdait déjà contre une IA, on peut se dire que la performance d’AlphaGo est logique et qu’elle suit les avancées technologiques des algorithmes. Or c’est pourtant une véritable performance, car contrairement aux échecs, le jeu de go possède une liberté et une subtilité de placement qui est beaucoup plus large. « Les joueurs ont des styles de jeu différents. Sur 20 000 parties que j’ai jouées, aucune ne se ressemblait » confie le champion de France.
En moyenne, un joueur d’échec a la possibilité de jouer entre 20 et 30 coups, pour le go c’est en moyenne 300. Cette multitude de possibilité de coup complique largement le travail de l’IA qui ne peut plus se contenter de calculer toutes les probabilités mais bien de « réfléchir ».
La toute puissance d’une machine
Développé par l’entreprise DeepMind, rachetée par Google en 2014, AlphaGo est un programme informatique capable de jouer au jeu de Go mieux que l’homme. C’est en 2015 qu’il le prouve pour la première fois face au champion d’Europe Fan Hui. Par la suite, le programme fera face à des adversaires de plus en plus fort avec toujours le même résultat : une victoire. Pourtant « avant le match avec Lee Sedol, personne ne s’attendait à ce qu’il perde » nous révèle Benjamin Dréan-Guénaïzia. « Ça a donné des séquences qu’on n’avait jamais vu avant » avoue le champion français.
La question que l’on se pose alors est la suivante : comment une machine créée par l’homme arrive-t-elle à le devancer ?
Cela s’explique notamment par son apprentissage. Les premières versions d’AlphaGo étaient basées sur les données de 100 000 parties jouées par des amateurs doués. Avec l’apprentissage par renforcement, le programme imitait en fait le joueur humain puis progressait en jouant contre lui-même. Il lui a fallu plus d’un million de jeux contre différentes versions de lui-même pour apprendre de ses erreurs et battre Fan Hui.
« Ce qui est fort c’est qu’un an après, ils ont fait la même chose sauf qu’ils ont fait une version où il n’y avait aucune base de données humaines, AlphaGo a uniquement apprit en jouant contre lui-même et au bout de 40 jours, il avait le meilleur niveau du monde, pour moi c’est ça la vraie révolution » – Benjamin Dréan-Guénaïzia
C’est là qu’on peut parler de deep learning, la machine a appris seule avec comme unique base, des réseaux de neurones profonds qui imitent ceux du cerveau humain.
Le « cerveau » d’AlphaGo regroupe notamment trois composantes principales :
→ Le réseau stratégique : à partir d’entrainements aux parties de niveau élevé, il imite les joueurs.
→ Le réseau de valeurs qui évalue les positions du plateau (dynamiques) et détermine la probabilité de victoire dans une situation donnée.
→ L’arbre de recherche qui analyse les différentes variations de la partie pour tenter de savoir ce qui va se produire.
« L’IA a un sens global beaucoup plus développé que le nôtre »
« Au début je jouais contre l’IA, mais je me suis rendu compte que prendre 40 massacres à la suite ce n’était pas forcément très bon niveau psychologique », nous dévoile Benjamin Dréan- Guénaïzia. Et c’est parce que la machine a un sens global beaucoup plus développé que le nôtre. Elle a une rapidité et une capacité de lecture de séquences et de direction de jeu impressionnante en plus de sa précision de calcul exemplaire. « Une séquence de 30 à 40 coups un humain peut la lire mais l’IA va la lire en 30 ou 40 secondes » nous donne comme exemple le champion de France. L’ordinateur va réussir à garder une avance stable tout au long de la partie, chose qu’un humain ne pourra pas faire. Durant sa partie, il va chercher à se solidifier, de manière à assurer sa victoire mais sans vouloir gagner du mieux qu’il peut. Cela peut complétement déconcentrer un humain. De plus, quand on joue contre une machine « on se sent vraiment contre un mur infranchissable et qui n’a absolument aucune émotion ». Tout le côté psychologique entre alors en jeu et le rend encore plus complexe.
IA comme moyen de devenir plus fort au jeu
Imbattable certes, mais utile. De nombreux joueurs se servent des intelligences artificielles comme le logiciel libre Leela qui permet de retracer son parcours de jeu. Cela permet de progresser plus rapidement en observant ses points forts et ses points faibles avec des pourcentages. Par exemple, si on pose cette pierre à cet endroit, on a 70% de chance de gagner la partie, c’est d’ailleurs comme ça que fonctionne l’intelligence artificielle quand elle joue.
L’homme apprend à la machine et la machine apprend à l’homme. Maintenant qu’AlphaGo est champion du monde l’entreprise Deepmind va chercher à comprendre comment il en est arrivé là : « on a créé quelque chose qu’on ne connait pas bien, du coup on va chercher à comprendre comment il réfléchit », avance Fan Hui – lors de la conférence Futur en Seine – sur l’avenir de cette machine.