IA : Google DeepMind esquisse SIMA, son agent intelligent qui apprend à jouer aux jeux vidéo

Les bots sont omniprésents dans les univers ludiques, mais avec SIMA, Google DeepMind entraine un agent intelligent qui apprend à jouer au contact des autres joueurs et comme un joueur humain, dans les mondes de plusieurs jeux en ligne. 

SIMA (Scalable Instructable Multiworld Agent)

Chez les humains comme chez les animaux, le jeu est une méthode d’apprentissage efficace. Manifestement, il en est de même pour les IA et agents intelligents. C’est du moins le raisonnement de Google DeepMind à propos de SIMA, pour Scalable Instructable Multiworld Agent, son agent mu par l’intelligence artificielle dont la vocation consiste à apprendre à évoluer dans les univers de jeux vidéo en 3D, pour « jouer » au contact des vrais joueurs.

On le sait, Google DeepMind fait jouer ses agents intelligents depuis longtemps – il y presque une dizaine d’années, on se souvient que l’IA du studio battait le maître go Lee Sedol au jeu de go, ou encore quelques années quand l’IA AlphaStar apprenait à jouer à StarCraft II pour affronter de vrais joueurs incognito.

Un agent intelligent qui apprend des autres joueurs

Aujourd’hui, SIMA adopte une approche un peu différente : l’IA s’aventure dans les univers de différents jeux non pas « pour gagner » mais pour cohabiter et interagir avec les autres joueurs et répondre à des instructions de base. En d’autres termes, SIMA apprend des comportements simples qui doivent lui permettre d’explorer les mondes virtuels (s’exécuter quand on lui demande d’aller à gauche), d’interagir avec l’environnement (grimper à une échelle) ou encore d’interagir avec des menus (ouvrir la carte de l’univers de jeu). Aujourd’hui, SIMA maîtrise déjà 600 compétences de base. À terme, l’agent doit apprendre à exécuter des commandes plus complexes, nécessitant « une planification stratégique » comme le fait de ramasser des ressources pour construire un campement.

Pour son études, Google s’est associé à neuf studios de développement de jeux et SIMA s’entraine dans leurs univers – incluant par exemple le jeu d’exploration No Man’s Sky signé par Hello Games ou Valheim et Satisfactory édités par Coffee Stain, Space Engineer de Keen Software House ou encore Eco de Strange Loop Games, parmi d’autres. Pour prendre la mesure du comportement des agents, Google précise que certains de ses agents s’entrainent dans tous les jeux, d’autres se spécialisent dans un jeu en particulier et les études de DeepMind révèlent qu’un agent polyvalent (qui s’est entrainé dans plusieurs jeux) est plus efficace qu’un agent spécialisé et quand un agent polyvalent découvre un nouveau jeu, il se révèle presque du même niveau qu’un agent spécialisé qui s'est entrainé spécifiquement dans le jeu en question. En d'autres termes, plus l'agent joue, plus il est familier des mécaniques ludiques en général et plus il trouve ses marques aisément dans les mondes virtuels qu'il découvre. 

SIMA n’est donc pas un bot comme on en croise déjà fréquemment dans les univers ludiques (programmé pour exécuter des tâches bien spécifiques). SIMA est un agent qui apprend grâce aux instructions qu’on lui donne : en d’autres termes, l’IA a accès aux images du jeu et comprend les instructions en langage naturel qu’on lui communique, mais pas à accès au code source du jeu et n’est pas régie par un script. Elle contrôle son personnage simplement via les commandes du clavier et de la souris « comme un vrai joueur ».

Vers « des agents plus généraux capables de comprendre (...) un large éventail de tâches de façon utiles aux utilisateurs en ligne et dans le monde réel »

Selon les équipes de Google DeepMind, il reste encore beaucoup à faire pour rendre SIMA aussi efficace qu’un vrai joueur, mais à terme, l’agent intelligent pourrait se révéler un compagnon d’arme à même de comprendre les attentes des joueurs et de les seconder dans leurs pérégrinations. À plus long terme, cet apprentissage affiche aussi de plus hautes ambitions : Google indique orienter ses recherches vers « des systèmes et agents intelligents plus généraux, capables de comprendre et d’effectuer en toute sécurité un large éventail de tâches de façon utiles aux utilisateurs en ligne et dans le monde réel ». Bigre !

Réactions (19)

Afficher sur le forum

  • En chargement...