Después de estar trasteando durante unas semanas con varios de estos programas os dejo mis recomendados (solo en local, nada de utilizar IA online).
Stable Diffusión, este es el primero y es imprescindible, va por su versión 2.1 y se puede instalar en el PC de manera local (como los demás que mencionaré).
Sus cualidades son darle un texto escrito y que la IA lo interprete en imágenes, también se le pueden descargar otros Modelos entrenados para obtener un tipo de imágenes específicas (vienen en formato .pkpt), o se pueden descargar y añadir embeddings que son rápidos de descargar y añaden nuevos estilos y palabras a Stabble Diffusion que se pueden utilizar para generar las imágenes en los nuevos estilos (vienen en formato .pt).
La otra cosa que hace es poder modificar una imagen a partir de otra imagen, con una descripción de la misma (prompts) o incluso puedes utilizar un botón que detecta automáticamente lo que hay en la imagen para que saque los prompts automáticamente. Tras tener tu imagen las puedes cambiar o reinterpretar tanto como quieras.
El problema con Stable Diffusión es que es el más complicado de utilizar, tienes que ser más descriptivo, y añadir muchos más propts para lograr un resultado espectacular (aunque en cuanto le pillas el truco todo es sencillo) y eso es precisamente porque ofrece una cantidad de opciones y de configuraciones casi infinitas que te permiten hacer casi cualquier cosa.
Un ejemplo de uso: Pides un caballo y te sale con cinco patas, la solución si te gusta esa imagen es utilizar la misma semilla y parametros (así no cambiará la imagen) y añadir algo al prompt “[leg]” (sin comillas) porque los corchetes restan intensidad al parámetro, así que al generar de nuevo la imagen el caballo es probable que aparezca con cuatro patas, los paréntesis sin embargo hacen lo contrario, dan intensidad a los seleccionado “(leg)” haría que fuera más probable que aparecieran más de cuatro patas, y no solo eso, la intensidad se puede regular “(leg)” sería un poco más de intensidad (leg:1.99) sería con muchísima intensidad, “(Leg:1.05)” solo un poco más de intensidad (se entiende el ejemplo supongo).
También cada una de los controles deslizantes y opciones sirven de algo, pero una vez que los entiendes puedes hacer maravillas.
Por otra parte también te permite añadir la extensión Dreambooth la cual permite que entrenemos en nuestro PC a la IA con nuestras propias imágenes y fotos.
La siguiente herramienta es InvokeAI, se basa en Stable Diffusion y puede generar imágenes igual, pero se especializa principalmente en el inpaiting y outpainting, o lo que es lo mismo, se pueden añadir cosas a una imagen, o incluso ampliar el tamaño del papel y rellenarlo de manera automática.
Timelapse de alguien trabajando con el que deja bien claras sus ventajas…
El último es Lama Cleaner que como alguno sospechará está especializado en borrar de la imagen, aunque también tiene una opciones parecidas a las de InvbokeAI que pueden añadir otras…
Acaban de añadir la opción de añadir objetos a una imagen utilizando para ello una referencia de otra imagen…
Y esto es todo hamijos, podéis ser unos completos inútiles y aún así tener un resultado decente.
Uish, se me olvidaba el último que permite modificar vídeos con el estilo artístico que queráis, basta tan solo modificar unos pocos fotogramas con el estilo que querais (cosa que podéis hacer con las IA de arriba).
EBSynth