Nouveau succès au jeu de go pour l'intelligence artificielle

19/10/2017 08:53

AlphaGo, le super-ordinateur qui avait fait sensation l'an dernier en battant le champion du monde de go, un jeu extraordinairement complexe, est tombé sur plus fort que lui : il vient d'être écrasé par une nouvelle version de ce programme, capable d'apprendre par lui-même, "en s'affranchissant de la connaissance humaine".

>>AlphaGo, l'ordinateur prodige au jeu de go, prend sa retraite

Le champion du monde chinois du jeu de Go, Ke Jie, se mesure à AlphaGo, le super-ordinateur, à Wuzhen en Chine.

AlphaGo Zero, ce nouveau programme "plus puissant", victorieux sur le score sans appel de 100 à 0 , "est sans doute le plus fort joueur de go de l'histoire", estiment Demis Hassabis et David Silver, deux de ses concepteurs, selon une étude publiée mercredi dans la revue Nature.

Au jeu de go, le nombre de combinaisons possibles est astronomique, plus grand que le nombre d'atomes dans l'univers. Les programmes informatiques, bien que très forts en calcul, ne peuvent donc pas passer en revue toutes les possibilités pour choisir la bonne mais doivent imiter les concepts stratégiques de l'homme.

Pour battre en 2016 Lee Se-Dol, grand maître sud-coréen du jeu de go (par quatre parties à une), AlphaGo avait été nourri des milliers de parties jouées par des professionnels et des amateurs, lui permettant ainsi "d'apprendre", pendant plusieurs mois, à copier le raisonnement humain par l'apprentissage profond ("deep learning" en anglais).

AlphaGo Zero, également développé par le britannique DeepMind, une filiale de Google spécialisée dans l'intelligence artificielle, est pour sa part capable "d'apprendre tout seul à jouer au go", précise l'étude.

Pour s'entraîner, AlphaGo Zero joue contre lui-même, "en partant de 0" sans autre connaissance sur le go que les règles du jeu. Contrairement à AlphaGo, il n'a donc pas eu besoin de se confronter à des humains pour devenir imbattable.

"Après trois jours d'entraînement (presque 5 millions de parties, ndlr) en autodidacte, il a battu la version de 2016 d'AlphaGo", expliquent Demis Hassabis et David Silver sur un blog.

Toujours besoin des humains

Et alors qu'AlphaGo nécessitait plusieurs machines, son successeur fonctionne avec une seule.

"Ce n'est pas le premier logiciel qui apprend par lui-même, la nouveauté c'est que AlphaGo Zero soit si bon", souligne le futurologue Anders Sandberg de l'Université d'Oxford.

La victoire d'AlphaGo sur Lee Se-Dol l'an dernier avait fait sensation : c'était la première fois qu'un logiciel écrasait un joueur chevronné lors d'un match entier.

Cette victoire avait été saluée comme une percée technologique pour les ordinateurs, désormais capables non seulement de conduire des voitures mais aussi d'aider l'humanité à résoudre quelques-uns des problèmes scientifiques, techniques ou médicaux les plus ardus.

Déjà en 1997, le champion du monde d'échecs Garry Kasparov avait été vaincu par l'ordinateur Deep Blue d'IBM. Mais le défi pour la machine semblait bien plus relevé au jeu de go, dans lequel deux adversaires tentent d'occuper le plus d'espace sur un plateau quadrillé en plaçant alternativement des pierres noires et blanches.

Avec AlphaGo Zero, une nouvelle étape est franchie, dans la mesure où le logiciel, pour apprendre, n'est "plus contraint par les limites de la connaissance humaine", selon les concepteurs de DeepMind.

Dans certains domaines, les connaissances peuvent être difficiles à réunir voire inexistantes. Il est alors difficile de "nourrir" les logiciels d'exemples et de données pour leur permettre de s'entraîner. L'auto-apprentissage permet de sauter cette étape parfois difficile à mettre en place.

Mais si elle peut se passer avec succès de l'expérience humaine pour se perfectionner, la machine dépend néanmoins toujours de l'intelligence des hommes : "Les brillantes idées qui ont permis d'améliorer le programme ont été générées par l'homme", précise Anders Sandberg. "AlphaGo ne se programme pas tout seul !".

AFP/VNA/CVN

#jeu #AlphaGo Zero #Ke Jie

Lecourrier.vn

Autres articles

Deux attaques des talibans font 71 morts en Afghanistan

Le chef de l'ONU appelle à s'attaquer aux causes profondes de la pauvreté

France Télévisions en grève contre les coupes budgétaires

Macron lance sa nouvelle stratégie contre la pauvreté dès l'enfance

Incendies au Portugal et en Espagne : le bilan s'alourdit à 45 morts

Madagascar : l'épidémie de peste continue de se propager

Formation et assurance chômage : le gouvernement précise la méthode

La crise humanitaire "plus grave que jamais" à Raqa en Syrie

La tempête Ophelia fait trois morts en Irlande

Les pompiers domptent les feux californiens, le bilan grimpe à 41 morts

Soutien massif aux opérations anti-drogue aux Philippines, selon un sondage

Le bilan des incendies en Californie porté à 40 morts