KamiSeiTo a écrit : ↑mar. déc. 06, 2022 5:13 pm
Comme je le dis, le résultat est pas foufou par rapport à ce que ferait un humain. C'est plus le développement de ce genre d'outils, qui m’impressionne. J'en était resté aux phrases bancales sans lien les unes avec les autres et qui donc faisaient un texte sans queue ni tête.
J'y connais rien en informatique, mais avoir un programme informatique qui arrive à générer seul ce niveau de texte (même si oui le texte est non innovant, plat, et le style pas top), je trouve ça fou. Je parlais pas de l'utilité, mais ceci dit à la vitesse où ça va, dans 10 ans on aura peut-être des livres qui se vendent mieux que ceux des plus grands auteurs ! Et dans 50 ans j'ose même pas imaginer...
Et bien, pour ma part, je suis assez persuadé du contraire, pour deux raisons :
- la première c'est que cette même prédiction ("dans 50 ans les ordinateurs sauront comprendre le langage naturel") a déjà été faite ... dans les années 50. Et à l'époque la projection était plutôt "dans 10 ans" que dans "50 ans", et les informaticiens étaient persuadés qu'avoir un programme informatique à même d'interprêter du texte serait atteignable rapidement (= à même, à partir d'un texte donné en entrée, que le programme soit capable de répondre à des questions sur le contenu / la compréhension de ce texte). Soixante-dix ans plus tard, on n'y est toujours pas. Après, bien sûr, le contexte, les connaissances, les puissances de calcul, ... ne sont plus les mêmes, et les choses pourraient s'accélérer / on n'est pas à l'abri à un moment donné d'une découverte majeure, mais quand même, cette "erreur de prédiction" me laisse penser qu'il faut rester humble (et aujourd'hui rien ne me laisse personnellement penser qu'on est à l'aube d'une révolution sur ces sujets - plutôt à l'aube d'une "industrialisation" de mécanismes somme toutes relativement "bas niveaux")
- deuxième point, la manière dont ces textes (ou images, ou mécanismes du type détection visuelle, ou algorithme pour jouer tout seul à un jeu vidéo, etc.) sont obtenus. Ici pour le texte, par ex. : il n'y aucune règle, aucun mécanisme, aucune intelligence qui définit (d'une manière ou d'une autre) ce qu'est "un scénario", ce qu'est "un jeu de rôle", ce que veut dire "rédiger". Ces notions n'existent pas pour l'IA. Il n'y a aucune "règle de gestion" (écrite avec du code informatique) qui modélliserait d'une manière ou d'une autre ce qu'est un scénario, la progression de l'histoire, la notion de conclusion et de rebondissements et de protagonistes. Tout çà n'existe que dans la compréhension qu'un être humain en a. Quant à l'IA, la seule chose qu'elle fait (pour simplifier à l'extrême), c'est recomposer des morceaux de texte à l'infini. Et avoir pour chaque résultat une "note" décrivant la qualité du texte généré. Son objectif ensuite, par essais, itérations, piochages dans des bases de textes, d'avoir la meilleure note au final (et il y a de vraies questions aussi sur la "validation" de conformité de ce qui est produit) : et c'est pour çà qu'au bout d'un moment les textes finissent par ressembler à quelque chose, car pour que le texte soit reconnu comme étant de qualité, il faut (par ex.) que certains éléments soient repris d'un bloc sur l'autre. Ca se comprend bien aussi sur un jeu vidéo (certains moteurs d'IA arrivent à finir des jeux de plateforme ou de courses), l'IA va tenter par de nombreuses itérations tous les paramètres possibles (courir, sauter, accélérer, tourner, ...), avec un "score" au final (score ingame, temps avant "game over", etc.), et ainsi, par itération, arriver à trouver l'enchaînement d'étapes qui permettent de finir un niveau. Même chose que pour les textes.
Enfin, à l'inverse de tout ce que je dis juste avant (qui est un peu "pessimiste" quant aux capacités des IA futures (qui à ce stade restent donc des IA "faibles")), il va de soi qu'il sera quand même possible d'en tirer des choses bluffantes et intéressantes de ces mécanismes - là le bout de texte en exemple n'est effectivement pas foufou, je trouve aussi, mais :
- j'ai copié/collé le premier jet : chaque click sur "retry" génère un autre texte du même acabit, totalement différent du précédent (un peu comme
https://thispersondoesnotexist.com/ qui génère un nouveau visage à chaque F5)
- le texte en entrée était aussi ultra bateau (synopsis ... jeu de rôle ... auberge ... hum), bien sûr qu'avec un ensemble de mots clés plus fins, mieux tournés, quelques éléments forcés / quelques éléments exclus, etc., le résultat pourra être bien plus percutant.