Ajouter un commentaire

AlphaStar bat des joueurs professionnels de StarCraft II

Par:
fredericmazue

mar, 29/01/2019 - 16:18

En 2016 et 2017 AlphaGo, l'intelligence artificielle de la société DeepMind, filiale de Google, a battu les champions de Go Lee Sedol et le prodige Ke Jie. Dès 2016, DeepMind indiquait vouloir relever de nouveaux défis et s'attaquer à StarCraft II, avec l'ambition que son intelligence artificielle batte des joueurs professionnels.

Pourquoi StarCraft II ? DeepMind le considère comme le meilleur jeu à un contre un de tous les temps, la crème des jeu. Contrairement au Go ou aux Echecs, le monde de StarCraft n'est pas un monde ordonné où tous les paramètres sont définis à l'avance. StarCraft reproduit en quelque sorte le manque d'organisation du monde réel, souligne DeepMind. De plus, le brouillard fait que le jeu doit de nouveau être exploré à chaque partie. Alors un programme d'intelligence artificielle qui sera capable d'apprendre à bien jouer à StarCraft II, trouvera des applications dans le monde réel. C'est l'enjeu.

DeepMind a baptisé AlphaStar son programme d'intelligence artificielle pour StartCratf II. Le 19 décembre dernier, au cours d'un match en 5 parties, AlphaStar a battu Grzegorz 'MaNa' Komincz, qui figure parmi les plus forts joueurs deStarCraft professionnels du monde, sur le score de 5 à 0. Ceci après avoir battu au cours d'un match de référence Dario 'TLO' Wünsch, le coéquipier Grzegorz 

Les matches se sont déroulés dans des conditions de match professionnelles sur une carte en échelle de compétition et sans aucune restriction de jeu, précise fièrement DeepMind dans son communiqué.

DeepMind exlique : Le comportement d'AlphaStar est généré par un réseau de neurones profonds qui reçoit des données d'entrée de l'interface de jeu brute (une liste d'unités et de leurs propriétés) et génère une séquence d'instructions constituant une action dans le jeu. Plus précisément, l’architecture de réseau neuronal applique aux unités un torse de transformateur (similaire à  l’apprentissage par renforcement relationnel profond relationnel ), associée à un noyau LSTM profond , à une tête de stratégie auto-régressive avec un réseau de pointeurs et à une valeur de référence centralisée.. Nous pensons que ce modèle avancé contribuera à de nombreux autres problèmes de recherche en apprentissage automatique impliquant la modélisation de séquence à long terme et les grands espaces de sortie tels que la traduction, la modélisation du langage et les représentations visuelles.

Et ajoute : AlphaStar utilise également un nouvel algorithme d’apprentissage multi-agents. Le réseau de neurones a été initialement formé par apprentissage supervisé à partir de jeux humains anonymisés publiés par Blizzard . Cela a permis à AlphaStar d’apprendre, par imitation, les stratégies de base micro et macro utilisées par les joueurs de l’échelle StarCraft. Cet agent initial a vaincu l'IA intégrée de niveau «Elite» - autour du niveau de l'or pour un joueur humain - dans 95% des matchs.

Filtered HTML

Plain text

CAPTCHA
Cette question permet de vérifier que vous n'êtes pas un robot spammeur :-)
 X   X  U   U   CCC   SSS   FFFF 
X X U U C S F
X U U C SSS FFF
X X U U C S F
X X UUU CCC SSSS F