L’IA de Meta a surpassé les humains dans un jeu de société classique

Temps de lecture :3 Minutes, 0 Secondes

Les méta-chercheurs ont dévoilé l’algorithme d’intelligence artificielle Cicero, qui joue le jeu de société Diplomacy à un niveau humain. Le Registre écrit à ce sujet.

« Diplomacy » a été développé en 1953. Le jeu se concentre sur la communication et les négociations entre les participants. Chacun d’eux joue le rôle d’un des sept États européens du début du XXe siècle.

Réduisez vos frais d’échanges
Les frais d’échanges peuvent représenter plusieurs centaines de dollars chaque année. Pour cette raison, les bons tradeurs cherchent à les réduire car ils peuvent impacter fortement leurs résultats. Vous aussi vous pouvez le faire grâce aux liens ci-dessous :

Fondamentalement, Cicero est un chatbot qui négocie avec d’autres participants pour effectuer des mouvements efficaces. L’algorithme est basé sur un modèle de langage de type BART avec 2,7 milliards de paramètres.

Il a été pré-formé sur les textes d’Internet, ainsi que sur un ensemble de données de plus de 40 000 jeux Diplomacy joués en ligne. L’ensemble de données contenait plus de 12 millions de messages échangés entre les personnes pendant le jeu.

Capture d’écran du gameplay de « Diplomacy » mettant en vedette l’agent IA Cicero. Données : Méta.

La sortie de dialogue d’un agent IA est liée à son module de réflexion stratégique. Avec lui, Cicéron crée des « intentions » représentant l’ensemble de mouvements possibles pour différents joueurs.

« Le module de réflexion stratégique prédit les politiques des autres acteurs [вероятные действия] pour le mouvement actuel en fonction de l’état du conseil d’administration et du dialogue général, puis choisit une politique pour le mouvement actuel pour lui-même », ont déclaré les chercheurs.

Contrairement aux agents d’IA pour les échecs, les chercheurs ont appliqué l’apprentissage supervisé en utilisant les données des parties précédentes. Cependant, l’approche elle-même a créé un modèle crédule qui pourrait être facilement manipulé par des joueurs peu scrupuleux, ont déclaré les chercheurs.

Pour éviter de telles situations, les développeurs ont connecté l’algorithme de planification itérative piKL à Cicero. Avec lui, l’agent IA affine la prédiction initiale de la politique de l’autre joueur et des mouvements planifiés en fonction du dialogue entre le bot et les humains. L’algorithme essaie d’améliorer les ensembles d’actions attendus des participants en évaluant différentes options qui donneront les meilleurs résultats.

Au cours de deux mois, les chercheurs ont testé Cicéron dans 40 jeux diplomatiques anonymes. Selon les résultats des tests, l’agent AI est entré dans le top 10% des participants qui ont joué plus d’une fois. Dans le classement des utilisateurs qui ont joué à cinq jeux ou plus, l’algorithme a pris la deuxième place.

Sur les 40 matchs, la moyenne de Cicéron était de 25,8%, soit plus du double de la moyenne de 12,4% de ses 82 adversaires.

Le champion du monde de la diplomatie Andrew Groff a salué l’approche sans émotion de l’algorithme du jeu.

« Beaucoup de gens vont adoucir leur approche ou se venger, mais Cicéron ne le fait jamais. Il joue juste la situation comme il la voit. Par conséquent, il est impitoyable dans la mise en œuvre de sa stratégie, mais pas impitoyable dans le sens où cela agace les autres joueurs », a-t-il déclaré.

Selon les développeurs, Cicéron fait encore quelques erreurs. Cependant, ils s’attendent à ce que leurs recherches soient utiles pour d’autres applications, telles que les chatbots pour de longues conversations ou des personnages de jeux vidéo réalistes.

Meta a également publié le code source de Cicero afin que chacun puisse contribuer à son développement.

Rappelons qu’en novembre, le géant de la technologie a désactivé AI for Science trois jours après le lancement. L’algorithme a été accusé de générer des faux et de la désinformation.

Abonnez-vous aux actualités de ForkLog sur Telegram : ForkLog AI – toutes les actualités du monde de l’IA !

Vous avez trouvé une erreur dans le texte ? Sélectionnez-le et appuyez sur CTRL + ENTRÉE

Voir l’article original sur forklog.com