16 mars 2023

Firefl-AI

Pour faire suite au billet précédent, voici quelques images supplémentaires :

Les amateurs reconnaîtront l'inspiration ;-)

Mais bon, me direz-vous, comment ça marche ?
Alors, pour faire simple, vous pouvez vous rendre sur ce site qui permet de faire des essais simplement et gratuitement.
NB: le moteur complet peut être installé en local sur votre PC, ce qui vous donnera accès à une multitude de paramètres supplémentaires, mais ce n'est pas le but ici.

Par exemple, pour obtenir la première image ci-dessus (Inara), j'avais introduit les paramètres suivants :
Describe your image :
beautiful drawing of morena baccarin, wearing an indian saari, elegant, long hair:0.9, cleavage:0.7, in a dark indian decorated spaceship room, hangings, drapings:1.2, soft lighting, warm colors, intricate, shallow depth of field, science-fiction
Negative prompt :
distorted anatomy, distorted hands, cropped, distorted face:1.3, bad art
Avec 512x768 comme taille.

Pour la deuxième image (Kaylee), ceux-ci :
beautiful drawing of Jewel Staite as Kaylee, light brown hair, wearing a khaki overall, over a sleeveless shirt:1.2, chubby:1.0, in a spaceship engine room, intricate, science-fiction, shallow depth of field:1.2, cinematic, Kaylee: 1.4
Et
multiple limbs, distorted anatomy, distorted hands, cropped:1.2, distorted face:1.3, bad art, signature, text, logo, bare legs:1.2

Le premier champ décrit ce que vous voulez, le deuxième ce que vous ne voulez pas. Les entités sont séparées par des virgules, et on peut leur donner un poids (une valeur numérique indiquée après un caractère ':'). Par exemple, une valeur de 1.2 correspond à 120% pour augmenter l'effet ou la probabilité qu'il se produise. Un effet inférieur à 1 indique que vous ne voulez pas supprimer totalement l'effet, mais en diminuer l'importance. Dans l'exemple d'Inara, "cleavage: 0.7" dit que "je suis ok avec le décolleté, mais pas trop, s'il-te-plaît".

L'effet est néanmoins aléatoire. En introduisant exactement les mêmes paramètres que moi, la probabilité est très faible que vous obteniez la même image que moi.
Le principe est que le système génère du bruit aléatoire basé sur un "seed" (qui est la variable d'initialisation d'un générateur de nombre aléatoires) qui est lui-même aléatoire. Ensuite, l'IA (je répugne à appeler ces systèmes comme ça, mais c'est la mode) effectue des passes successives pour essayer d'identifier un truc qui correspond à ce que vous avez décrit. Ca commence par donner un truc très basique. On remet une couche de bruit (moins que dans l'itération précédente) et on repart pour un tour. Petit à petit, le système construit une image qui correspond plus ou moins à ce que vous avez demandé. Ou du moins à ce qu'il a interprété de votre demande.

Avec les mêmes paramètres et/ou quelques variations, on peut obtenir des images différentes jusqu'à trouver son bonheur, avec un peu de chance. Comme ci-dessous.

Lesquelles préférez-vous ?

3 commentaires:

Imaginos a dit…

Je trouve les Inara nettement plus ressemblantes que les Kaylee, pour qui la seule vraie ressemblance avec Jewel Staite est la salopette... Mais dans l'ensemble, je ne suis pas vraiment convaincu par le résultat.

Vaken a dit…

Si tu voyais les Mal 😄

bersek a dit…

Thank you very much for sharing the page. We plan to add the seed in the output, as well as in the options to generate the images. Another feature we are going to add is the possibility to choose the model.

Regards

Development team of stablediffusionai.org