DALL·E 3 : l’offensive de Microsoft

Verdict:Très Bon

par: Frédéric Beaufrere



DALL·E 3 : l’offensive de Microsoft

Microsoft et Bing ont récemment fait les gros titres dans le monde de l’intelligence artificielle avec la mise à disposition de DALL·E 3 pour le grand public, itération avancée du modèle de génération de texte et d’images. Une étape significative dans la démocratisation de l’utilisation de l’IA créative, puisqu’elle est capable de générer des images à partir de descriptions textuelles, même exprimées en français.

En élargissant ses capacités et en affinant sa compréhension du contexte, DALL·E 3 promet ouvre de nouvelles possibilités dans la création artistique, la publicité et d’autres domaines où la génération d’images à partir de textes est cruciale.

Faire un essai est simple, il suffit de vous connecter avec votre compte Microsoft sur le site suivant, puis de formuler en français ce que vous souhaitez que Dall-e crée pour vous :

https://www.bing.com/images/create?FORM=GERRLP


Dans ma première tentative et pour illustrer un jour ou l'autre une info sur un western spaghetti j'ai demandé la création d'une photo avec un cow-boy assis à table dans un saloon devant une plâtrée de spaghettis, le colt (gravé) posé sur la table. Voici le résultat :

 

On voit ici qu'il demeure une imperfection : les couverts sont à l'envers.

Mais le résultat est quand même plutôt bluffant pour quelqu'un dont c'est le premier prompt. On mesure tout de suite que les Applications Potentielles sont vastes et n’ont de limite que l’imagination du créateur du prompt, demande textuelle exprimée par l’utilisateur. Création de contenu visuel pour des sites Web, des publicités, des cartes d’anniversaire et bien plus encore sont à portée de verbe. Par exemple, pour la rédaction de cet article, j’ai demandé la réalisation d’une image représentant un Mandalorien terrassé par des chatons sur fond de plage paradisiaque (ne me demandez pas d'où ça m'est sorti, c'est apparu comme une évidence). Voici le résultat.



On imagine tout de suite que les professionnels de la création et du marketing trouveront dans cette technologie un allié puissant pour produire des images sur mesure en fonction de leurs besoins. L’IA est capable de comprendre et d’interpréter des descriptions textuelles complexes, ce qui signifie qu’elle peut s’adapter à une grande variété de secteurs et de projets créatifs.

Autre exemple, à l’occasion de la sortie de Robocop en jeu vidéo (très bon jeu au demeurant) et me demandant si un tel héros avait parfois le droit à un peu de repos, j’ai demandé la création d’une image de Robocop, assis sur des WC en train de lire le journal sur fond de décor post-apocalyptique. Voici le résultat.



DALL·E 3 est la preuve que l’IA créative continue de progresser à un rythme impressionnant. Elle démontre la capacité de l’IA à comprendre les nuances de la créativité humaine et à la traduire en contenu visuel. Bien que le modèle ait encore des limites et génère parfois des images souffrant d’artefacts, il offre un aperçu de l’avenir de la génération de médias assistée par l’IA.

Reste que son utilisation doit demeurer responsable et éthique puisque bientôt incontournable.

La volonté de Microsoft de démocratiser DALL·E 3, dans le prolongement de l’intégration de Chat-GPT dans BING, souligne la détermination du géant de l’informatique à rendre accessible tous ces outils fantastiques au commun des mortels. Il sera passionnant de voir dans un avenir proche comment cette technologie continuera d’évoluer et donnera naissance à de nouveaux réflexes de création, de délégation de tâches, de recentrage sur les fonctions essentielles de nos métiers.