Mais au fait, c’est quoi GPT ?

deep learning IA GPT
deep learning IA GPT

Ces trois lettres apparaissent désormais presque tout le temps dans les actualités liées à l’intelligence artificielle (IA). Auto-GPT, ChatGPT, GPT-4. Mais que signifie GPT et, surtout, qu’est-ce qui se cache derrière l’acronyme ?

C’est un acronyme que l’on voit désormais associé couramment à l’intelligence artificielle : « GPT ». Ces trois lettres se retrouvent dans le nom de ChatGPT, le fameux chatbot conçu par l’entreprise américaine OpenAI. Ou bien dans les modèles de langage qui servent à le faire fonctionner, comme GPT-3 et GPT-4. D’autres projets s’en servent aussi, comme Auto-GPT.

Que signifie GPT ?

GPT signifie en anglais Generative Pre-trained Transformer, soit transformeur génératif pré-entraîné. Il s’agit d’un modèle de langage développé par la société américaine OpenAI, qui sert de « moteur » à l’agent conversationnel (ou chatbot) ChatGPT. Plusieurs générations de GPT existent. Il y en a quatre en tout. Mais en disant cela, on ne saisit pas comment cela fonctionne.

La formulation Generative Pre-trained Transformer peut paraître intimidante de prime abord. Il s’avère néanmoins que l’on peut apprivoiser pas à pas en regardant chaque terme qui compose cet acronyme. Ainsi, le mot génératif sert à renseigner que le système est en capacité de générer du contenu : du texte ou des images par exemple.

Vous le voyez déjà avec ChatGPT, si vous avez utilisé cet outil : il produit des phrases cohérentes en se basant sur le texte que vous lui avez envoyé.

[Lire la suite]