La bourse est fermée
  • Dow Jones

    33 903,80
    -74,28 (-0,22 %)
     
  • Nasdaq

    11 474,38
    -147,33 (-1,27 %)
     
  • Nikkei 225

    27 433,40
    +50,84 (+0,19 %)
     
  • EUR/USD

    1,0866
    -0,0008 (-0,08 %)
     
  • HANG SENG

    22 069,73
    -619,17 (-2,73 %)
     
  • BTC-EUR

    21 334,59
    -556,90 (-2,54 %)
     
  • CMC Crypto 200

    524,78
    -13,09 (-2,43 %)
     
  • S&P 500

    4 041,02
    -29,54 (-0,73 %)
     

Cette IA apprend à jouer à Minecraft en imitant les humains

L’intelligence artificielle a connu un développement extrêmement important ces dernières années, grâce à l’apprentissage profond, et surtout grâce à l’apprentissage par renforcement. Avec cette méthode, l’IA effectue des actions aléatoires jusqu’à atteindre un but et obtenir une récompense, une méthode qui lui permet par exemple de battre les humains dans les jeux vidéo. Toutefois, la prochaine grande évolution de l’IA pourrait venir d’une autre méthode, l’apprentissage par imitation.

Avec cette technique, l’ordinateur apprend en imitant les humains. À l’heure actuelle, l’un des meilleurs environnements pour ce type d’apprentissage est le jeu Minecraft, où les joueurs évoluent dans un monde ouvert sans avoir un but spécifique. C’est ce qu’a fait OpenAI, qui a donc eu besoin de nombreuses heures de vidéos d’humains qui jouent à ce jeu.

Pour créer une pioche en diamant dans Minecraft, les joueurs doivent passer par de nombreuses étapes. © OpenAI
Pour créer une pioche en diamant dans Minecraft, les joueurs doivent passer par de nombreuses étapes. © OpenAI

Une IA pour annoter automatiquement 70 000 heures de jeu

Pour fonctionner correctement, l’apprentissage par imitation a besoin que les vidéos soient annotées afin de comprendre ce qui se passe. Les chercheurs d’OpenAI ont engagé des êtres humains pour créer des vidéos tout en enregistrant toutes les actions au clavier et à la souris. Ils ont ainsi obtenu 2 000 heures de vidéos. Ils ont ensuite entraîné une IA pour créer un modèle de dynamique inverse (IDM). En analysant les actions au clavier et à la souris, ainsi que le résultat produit à l’écran, il est capable d’annoter automatiquement les vidéos.

Il s’agit de la première étape d’une méthode d’apprentissage par imitation semi-supervisée que les chercheurs ont appelé « pré-entraînement vidéo » (VPT). Les algorithmes obtenus par IDM sont ensuite utilisés sur des vidéos trouvées sur le Web. Minecraft étant l’un des jeux les plus populaires, il existe beaucoup de vidéos réalisées dans le jeu par les fans. L’équipe a ainsi pu collecter 70 000 heures de vidéos, qui ont été...

> Lire la suite sur Futura

À lire aussi sur Futura