Orlov a écrit : ↑mer. mars 15, 2023 11:19 pm
je te renvoie à l'article de @Macbesse sur
Le Fix.
Ça ne change pas grand-chose au problème posé sur le plan social, mais je pense que ça brouille le débat si on part sur une incompréhension technique, donc je me permets de préciser : non, il n'y a pas de base de données avec des tags, dans laquelle l'IA irait piocher pour faire un montage. C'est ce qui fait que la question du copyright est compliquée.
Les IA prennent des images et s'en servent pour construire une représentation interne, relativement compressée (4go pour Stable Diffusion, ce serait bien peu pour stocker des milliards d'images), de ce que signifient certains mots en termes d'images. Il n'y a pas de stockage des peintures de Van Gogh, mais il y a une association de "van gogh" avec une zone de la représentation interne qui correspond à un certain style. De la même manière, il n'y a pas de stockage des images joyeuses ou tristes, mais une association du mot "triste" avec un certain style d'images (grisaille, pluie...). On est vraiment proche d'une "compréhension" partielle.
La raison pour laquelle ça marche bien de dire "dans le style de machin", c'est que ça permet facilement de cibler une zone de la représentation interne qui aura un style qu'on aime bien. Mais on peut théoriquement générer les mêmes images sans le mentionner dans le prompt.
Je ne dis pas ça pour dire qu'il n'y a pas de problème, mais plutôt qu'il ne faut pas croire qu'on le résoudrait en permettant aux artistes de ne pas servir pour l'entraînement des IA. Avec assez de données (on n'y est pas encore, mais ça arrivera), une IA qui n'a jamais vu Van Gogh pourra générer quelque chose dans le style de Van Gogh (si on sait où chercher dans la représentation interne).