Marchés français ouverture 7 h 22 min
  • Dow Jones

    35 227,03
    +646,95 (+1,87 %)
     
  • Nasdaq

    15 225,15
    +139,68 (+0,93 %)
     
  • Nikkei 225

    27 996,94
    +69,57 (+0,25 %)
     
  • EUR/USD

    1,1287
    0,0000 (-0,00 %)
     
  • HANG SENG

    23 349,38
    -417,31 (-1,76 %)
     
  • BTC-EUR

    44 891,58
    +1 357,40 (+3,12 %)
     
  • CMC Crypto 200

    1 310,86
    +50,70 (+4,02 %)
     
  • S&P 500

    4 591,67
    +53,24 (+1,17 %)
     

Bluffant ! Cette Intelligence artificielle transforme les mots en images

·2 min de lecture

Saisir une phrase et voir apparaitre à l’écran au fur et à mesure des images photoréalistes l’illustrant, c’est la prouesse que parvient à réaliser une Intelligence artificielle mise au point par Nvidia. Baptisée GauGAN 2, il s’agit d’un version évoluée de cette IA, puisque GauGAN avait déjà été présenté en 2019. À l’époque, l’IA savait déjà transformer des croquis en images photoréalistes. Nvidia propose d’ailleurs un logiciel baptisé Canvas pour utiliser ce procédé. La seule contrainte est que le logiciel nécessite une carte graphique puissante de la marque pour pouvoir fonctionner.

Pour transformer les mots en images, GauGAN 2 utilise un modèle d'IA génératif particulier qui a été entraîné à partir de 10 millions d'images de paysages. Il ne sait donc pas vraiment improviser si les mots clés ont plusieurs sens ou s’ils sont trop subtiles, mais ce n’est que le début.

La version 2.0 de « Dessine-moi un mouton » avec ces simples mots « Peignez-moi une image ». La recherche de NVIDIA montre que la démo d'art GauGAN AI répond maintenant aux mots. © NVIDIA Developer

Mixer les mots clés et les croquis

Mieux encore, il est possible de mixer les fonctions de Canvas et celles des mots clés pour combiner le texte et des dessins. Le procédé permet d’aller plus loin dans la personnalisation du rendu en s’appuyant sur le croquis.

Sur son blog, le fondeur a publié une petite vidéo qui montre GauGAN 2 à l’œuvre. Sur une page web, l’utilisateur saisi progressivement des mots clés, tels que ocean waves hitting rocks on the beach (« les vagues de l'océan frappent les rochers sur la plage ») et l’on voit s’afficher les images correspondantes au fur et à mesure de la frappe. Impressionnant ! Nvidia propose de tester l’IA depuis un navigateur mais lors de nos tentatives, la page ne répondait pas.

> Lire la suite sur Futura

À lire aussi sur Futura

Notre objectif est de créer un endroit sûr et engageant pour que les utilisateurs communiquent entre eux en fonction de leurs centres d’intérêt et de leurs passions. Afin d'améliorer l’expérience dans notre communauté, nous suspendons temporairement les commentaires d'articles