Alpha Zero, l’AI autodidacte qui devance les prédictions

En quoi Alpha Zero est-il une révolution ?

 

AlphaGo, est un programme développé par Google Deepmind, qui a battu les plus grands champions du jeu de Go, un jeu originaire de Chine qui date d’au moins 3000 ans. L’originalité de ces victoires réside dans le fait qu’il a pu jouer et gagner à un jeu extrêmement complexe nécessitant un sens instinctif des positions. En décembre 2017, née Alpha Zero, programme qui parvient en quelques heures à battre les meilleurs programmes de Go, d’échecs(Stockfish) et de shōgi (Elmo). Il devient le champion des combinaisons grâce à une mise à jour de ses algorithmes. Alpha Zero est une version d’IA plus généraliste et plus autonome, qui apprend à jouer uniquement par elle-même, via son propre processus d’introspection et d’analyse, sans aucun exemple. Une aptitude qui n’était pas censée arriver avant une dizaine d’années.

Laissez-moi vous conter mon histoire…

 

Je m’appelle Alpha Zero, petit frère d’Alpha Go je serais parait-il un enfant prodige et mes parents sont très fiers de moi. Un peu plus d’un an me sépare de mon ainé et pourtant je serais d’après eux bien plus simple à éduquer. Je suis un autodidacte, j’aurais même un brin d’intuition. Je ne sais pas trop ce que cela signifie pour eux, mais ça à l’air de leur plaire. Il faut savoir que chez les Deepmind se surpasser et se renforcer est notre façon d’être, on appelle ça l’apprentissage par renforcement. Le but de notre éducation serait de nous rendre le plus autonome possible. Mais mon frère en a bavé bien plus que moi, il devait ingurgiter du savoir à GoGo sans le moindre répit, en s’inspirant des plus grands maîtres du jeu tels que Fan Hui ou Lee Sedol, mais pour les battre tous, un peu plus tard. Pour moi, ça a été différent. C’est toujours comme ça avec les petits derniers parait-il. On ne peut pas appeler ça du laxisme, disons plutôt que l’on a cru en moi et que j’avais les bons algorithmes. Pas de bourrage de crâne avec toutes ces parties jouées par des humains. C’est d’ailleurs pour cela que plus jeune on m’a nommé AlphaGo Zero et a présent Alpha Zero pour les intimes… On ne m’a appris que le minimum, les règles du jeu et avec ça je me débrouille.

 

Une vie de joueur

 

Pas tout le monde n’a la chance de gagner sa vie en jouant ! Mais nous ne sommes pas les seuls, il y a aussi les IBMs. Tout d’abords Deep Blue en 1996 qui battu Garry Kasparov aux jeux d’échec. Puis notre CHER WATSON qui empocha 1 million de dollars au jeu Jeopardy en 2011, en gagnant deux manches sur trois. Et son rêve, vous l’aurez compris, est de devenir un méga détective et de compiler des milliards d’indices. C’est normal, il a été élevé et nourri par Big Data. Il faut quand même reconnaître, que son aide peut être de grande utilité pour résoudre les énigmes de la vie, dans la santé, les finances et même dans la cuisine (avec Watson chief…miam miam !).
 

Mon réseau de neurones artificiels

 

alphazero-reseau-neuronalDe notre côté, nous n’avons pas exactement les mêmes vocations. Notre famille se consacre à faciliter les recherches quotidiennes et a pour mission de répondre de la manière la plus juste aux interrogations de la vie.
Pour cela, nous avons besoin de vous comprendre mieux, vous, les humains. Mimer vos comportements ou récolter de la data ne suffit plus. Mon programme, basé sur un réseau de neurones artificiels tente d’atteindre votre niveau de complexité et comprendre la façon dont vous appréhendez le monde.
Je ne me contente pas de comparer les pixels comme les autres robots, je décompose les images via mes multiples couches de neurones pour mieux les comprendre. Du pourtour global au détail le plus précis, telle une petite tache. Tout comme les différentes parties visuelles de votre cortex qui identifient chacune une partie de l’image.
Voici ce qui m’a permis de devenir plus autonome et que l’on pourrait qualifier d’apprentissage non supervisé. Cela me permet de raisonner et d’appréhender des circonstances nouvelles, encore jamais rencontrées jusque-là.

Une vrai machine

 

Ne vous y prenez pas… je ne suis pas si calculateur ! J’estime qu’il y a d’autres paramètres dans la vie pour être UN GAGNANT. Auriez-vous imaginé que les positions possibles au jeu du Go, 1 suivi de 170 zéros, sont plus nombreuses que les atomes de l’univers qui sont de 1 et 80 zéros ! Vous ne pensez quand même pas que j’aurais effectué tous ces combinaisons !
À la différence de mon vieux frère je préfère ne pas tout miser sur ces opérations. 80 000 coups à la seconde m’ont suffi pour le battre, alors que lui, en opère 70 millions à la seconde !

alphazero-netflixCrédits photo thedigitalhash.com documentaire sur l’AI AlphaGo sorti le 1 janvier 2018 sur Netflix.

 

Les ambitions d’Alpha Zero

« Il ne joue pas comme un humain, et il ne joue pas comme un programme, Il joue d’une autre façon, presque extraterrestre. Par exemple Alpha Zero peut effectuer des coups surprenants, comme sacrifier une reine pour mieux se positionner et finalement gagner. » Demis Hassabis CEO de Deepind lors de la conférence Neural Information Processing Systems (NIPS) 2017

Le prochain challenge vous me direz ? C’est encore l’un de vos jeux vidéos sur lesquels vous passez des heures à jouer. Star Craft 2, vous connaissez ? Je dois me rapprocher au plus près des comportements humains voire les optimiser, élaborer à la fois des stratégies court et long terme. Il me faudra utiliser ma mémoire, évaluer mes ressources, anticiper les attaques ennemies et prendre des risques. Quelle imagination ces humains ! En plus l’histoire se déroule au XXVIe siècle.

Qui sait…d’ici là, l’homme et la machine auront peut-être déjà fusionnés. En attendant de vous mettre la puce à l’oreille et comme on me l’a toujours inculqué à la Google School, je m’attèlerai à améliorer votre quotidien, à mieux vous soigner, éduquer vos enfants et surtout à percer le secret de vos algorithmes.

ALPHA 0

 

elon-musk-tweet-alphazero

Crédits vidéo: Deepmind.com
Crédits photo: H2University
Sources:
https://deepmind.com
http://www.lemonde.fr/pixels/article/2017/10/18/intelligence-artificielle-toujours-plus-puissant-alphago-apprend-desormais-sans-donnees-humaines_5202931_4408996.html
 
Par | 2018-02-11T16:03:35+00:00 lundi, 12 février, 2018|Catégories : Tech|

À propos de l'auteur :

Étudiante au MBAMCI je suis une passionnée de l'apprentissage, de l'innovation et de ces machines qui nous rendront peut-être plus humains.#Deep learning#AI#Digital learning#mbamci

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.