Une introduction au logiciel de génération d’images à partir de texte qui ne laisse pas indifférent.
Qu’est-ce que Dall-E ?
Dall-E (se prononce Dali, comme le peintre) est un programme d’intelligence artificielle (IA) conçu par la société californienne OpenAI qui transforme des phrases (pour l’instant en anglais, comme celle-ci traduite en français « Un cheval blanc galopant le long d'une plage au coucher du soleil ») en images. La première version de l’IA a été mise en ligne en janvier 2021 ; la nouvelle version est disponible depuis septembre 2022. Chaque texte ou suite de mots envoyé à l’IA s’appelle une requête. Une requête génère 4 propositions d’images différentes qui sont téléchargeables et modifiables. Dall-E peut également produire à partir d’une image qu’on lui soumet ou faire des variations à partir d’une image produite par l’outil comme par exemple reconstituer un décor autour d’un portrait (Outpainting).
Mais comment Dall-E associe-t-il une image à du texte ?
C’est le point névralgique du système. Dall-E combine plusieurs technologies dont l’une dénommée CLIP (pour Contrastive Language-Image Pre-training), a été entraînée pour faire le lien sémantique entre une image et sa légende à partir de millions d’images légendées stockées sur Internet. La technologie utilisée pour la compréhension des instructions en texte est ChatGPT.
Comment accéder à Dall-E ?
L’inscription sur la plateforme est gratuite mais peut être soumise à une liste d’attente. Chaque requête demandée à l’IA (sous forme de phrase ou d’image) coûte un crédit. 50 crédits sont gratuitement fournis au moment de l’inscription, ainsi que 15 crédits tous les mois. Mais il est possible également d’en acheter (115 unités pour 15 $). Les crédits gratuits sont valables un mois, les payants, douze mois.
Y-a-t-il d’autres IA de génération d’images ?
Dalle-E n’est pas le seul générateur d’images à partir d’un texte. Il en existe de très nombreux et de qualités très variables. Parmi les plus connus, Stable Diffusion (développé par un groupe de recherches de l’Université de Munich), Midjourney, considéré par beaucoup de graphistes comme le plus créatif et la plus artistique, Dream, optimisé pour les smartphones ou Craiyon. Certains utilisateurs peuvent combiner plusieurs outils.
Et déjà sont apparus sur le marché, des logiciels de création de vidéos par IA comme Gen-1 (Runway Research)
Quels sont les usages possibles ?
A l’instar de la nouvelle version de Dall-E, les logiciels de création d’images à partir d’un texte sont de plus en plus sophistiquées et produisent des images très réalistes. De nombreux illustrateurs craignent que les entreprises utilisent les logiciels d’IA pour illustrer leur communication interne ou externe, à commencer par les médias. On voit également apparaître sur Internet des sites de ventes en lignes d’images produites par IA comme Beep Boop Art Shop. Un article récent du New York Times évoquait également comment l’IA permettrait de « dessiner » des protéines qui n’existent pas dans la nature, afin de lutter contre certaines maladies.
Les images générées par l’IA sont-elles de l’art ?
La réponse à cette question ne peut avoir de réponse définitive car elle renvoie au débat sur ce qu’est l’art. Il faut reconnaître qu’en apparence, certaines images générées par IA sont en apparence très proches de ce que le street art, les NFT Art ou la photographie offrent couramment. Mais ce ne sont que des images numériques que l’on peut au mieux visionner sur un écran ou imprimer. De son côté le droit est plus affirmatif est a rejeté à plusieurs reprises des demandes de protection au titre du droit d’auteur des « œuvres IA ».
Qui est l’auteur des œuvres produites par Dall-E ?
En principe, les images créées par IA ne sont pas protégées par le droit d’auteur. En revanche une œuvre produite par IA et modifiée par un utilisateur est susceptible d’être protégée si elle porte l’empreinte de la personnalité de l’utilisateur. Par ailleurs, certains artistes revendiquent une part significative dans les créations au motif qu’ils doivent parfois faire des centaines de requêtes avant que l’outil ne produise l’image adéquate.
Cependant la nature des droits des images créées par Dall-E est encore floue. A ce jour, OpenAI n’autorise pas l’utilisation commerciale des images créées par Dall-E et demande qu’une diffusion d’une image Dall-E soit accompagnée de l’indication que tout ou partie de l’image a été produite par Dall-E.
Aux États-Unis, plusieurs procès sont en cours, opposant des artistes ou des banques d’images à des entreprises mettant à disposition des outils de création d’image par IA, leur faisant griefs d’utiliser leurs œuvres pour nourrir leur base d’images.
Qui est OpenAI ?
OpenAI est un laboratoire d’IA basé à San Francisco. Il a été fondé en 2015 par Elon Musk, Peter Thiel et Reid Hoffman, tous les trois des anciens de PayPal, et l’entrepreneur Sam Altman. Musk a quitté l’entreprise en 2018. OpenAI est à sa création une organisation à but non lucratif, mais devient une entreprise commerciale en 2019 pour attirer des capitaux. Sa première source de revenus est l’accès payant à ChatGPT et Dall-E. Mais ces recettes ne sont rien (80 millions de dollars en 2022) à côté du partenariat avec Microsoft. Le géant de Seattle a déjà apporté 3 milliards de dollars à OpenAI et s’apprête à lui apporter 10 milliards de dollars de plus en contrepartie d’une exclusivité d’utilisation de ses technologies pour sa suite Office et son moteur de recherche Bing.
Qu’est-ce que ChatGPT ?
ChatGPT est un agent conversationnel développé par OpenAI et basé sur le modèle de langage GPT-3. Sa plateforme a ouvert en novembre 2022. Ce générateur de texte est capable d'écrire des textes en déterminant les suites les plus logiques de chaque mot. Pour l’instant gratuite, l’application a atteint en janvier 2023 - deux mois seulement après son lancement - 100 millions d'utilisateurs.
Quels sont les enjeux de ce type de logiciel ?
De nombreuses questions éthiques se posent. Le fait que ces images soient issues du brassage de millions d’autres sur Internet fait craindre un renforcement des stéréotypes visuels. OpenAi reconnaît ainsi que certaines requêtes renvoient des images « clichés » comme une image de juge ou d’infirmière.
Des images virtuelles particulièrement réalistes peuvent aussi être utilisées à des fins malveillantes (désinformation, manipulation, etc…).
Pour l’instant, ces outils s’interdisent de produire des images à partir d’instructions sexuelles (y compris le nu), politiques ou violentes, mais pour combien de temps encore ?
Ces logiciels vont-ils remplacer les illustrateurs ou ne seront-ils qu’un outil de plus à leur disposition comme l’est Photoshop ?
L’accès à la totalité de l’article est réservé à nos abonné(e)s
Dall-E, l’IA de génération d’images en 10 questions / réponses
Déjà abonné(e) ?
Se connecterPas encore abonné(e) ?
Avec notre offre sans engagement,
• Accédez à tous les contenus du site
• Soutenez une rédaction indépendante
• Recevez la newsletter quotidienne
Abonnez-vous dès 1 €