Las mejores herramientas que podéis instalar en vuestros PC para generar imágenes con Inteligencia Artificial

Después de estar trasteando durante unas semanas con varios de estos programas os dejo mis recomendados (solo en local, nada de utilizar IA online).

Stable Diffusión, este es el primero y es imprescindible, va por su versión 2.1 y se puede instalar en el PC de manera local (como los demás que mencionaré).

Sus cualidades son darle un texto escrito y que la IA lo interprete en imágenes, también se le pueden descargar otros Modelos entrenados para obtener un tipo de imágenes específicas (vienen en formato .pkpt), o se pueden descargar y añadir embeddings que son rápidos de descargar y añaden nuevos estilos y palabras a Stabble Diffusion que se pueden utilizar para generar las imágenes en los nuevos estilos (vienen en formato .pt).

La otra cosa que hace es poder modificar una imagen a partir de otra imagen, con una descripción de la misma (prompts) o incluso puedes utilizar un botón que detecta automáticamente lo que hay en la imagen para que saque los prompts automáticamente. Tras tener tu imagen las puedes cambiar o reinterpretar tanto como quieras.

El problema con Stable Diffusión es que es el más complicado de utilizar, tienes que ser más descriptivo, y añadir muchos más propts para lograr un resultado espectacular (aunque en cuanto le pillas el truco todo es sencillo) y eso es precisamente porque ofrece una cantidad de opciones y de configuraciones casi infinitas que te permiten hacer casi cualquier cosa.

Un ejemplo de uso: Pides un caballo y te sale con cinco patas, la solución si te gusta esa imagen es utilizar la misma semilla y parametros (así no cambiará la imagen) y añadir algo al prompt “[leg]” (sin comillas) porque los corchetes restan intensidad al parámetro, así que al generar de nuevo la imagen el caballo es probable que aparezca con cuatro patas, los paréntesis sin embargo hacen lo contrario, dan intensidad a los seleccionado “(leg)” haría que fuera más probable que aparecieran más de cuatro patas, y no solo eso, la intensidad se puede regular “(leg)” sería un poco más de intensidad (leg:1.99) sería con muchísima intensidad, “(Leg:1.05)” solo un poco más de intensidad (se entiende el ejemplo supongo).

También cada una de los controles deslizantes y opciones sirven de algo, pero una vez que los entiendes puedes hacer maravillas.

Por otra parte también te permite añadir la extensión Dreambooth la cual permite que entrenemos en nuestro PC a la IA con nuestras propias imágenes y fotos.

La siguiente herramienta es InvokeAI, se basa en Stable Diffusion y puede generar imágenes igual, pero se especializa principalmente en el inpaiting y outpainting, o lo que es lo mismo, se pueden añadir cosas a una imagen, o incluso ampliar el tamaño del papel y rellenarlo de manera automática.

Timelapse de alguien trabajando con el que deja bien claras sus ventajas…

El último es Lama Cleaner que como alguno sospechará está especializado en borrar de la imagen, aunque también tiene una opciones parecidas a las de InvbokeAI que pueden añadir otras…

Acaban de añadir la opción de añadir objetos a una imagen utilizando para ello una referencia de otra imagen…

Y esto es todo hamijos, podéis ser unos completos inútiles y aún así tener un resultado decente.

Uish, se me olvidaba el último que permite modificar vídeos con el estilo artístico que queráis, basta tan solo modificar unos pocos fotogramas con el estilo que querais (cosa que podéis hacer con las IA de arriba).

EBSynth

8 Me gusta

Gracias, estoy usando SD y me van a venir de lujo el resto de herramientas, a ver si me animo a probarlas que tienen una pinta excelente.

1 me gusta

Yo te lo recomiendo, mezclando estos pocos programillas puedes hacer de todo si sabes como utilizarlos.

1 me gusta

Pregunta del millón.

Tengo un texto un poco largo que me gustaría trasladar, pero siempre excedo el límite.

¿Hay alguna donde no sean puñeteros con esto?

Texto en cuestión:

“An overcrowded slum. The entrance to an underground bar that is accessed from some stairs hidden in a nook in a façade. It rains to sing to you. It is pitch black. The scene is illuminated by white neon lights. The ground is puddled. There is dirt, piles of garbage, scrap metal and electrical wiring strung on poles. Heat and a more welcoming light escape from the entrance of the bar. Two people go out into the street. A young man in jeans and a puffer coat and a white-haired teenage girl in bike shorts and a zip-up military jacket that is too big for her. He hugs her around her waist, pulling her along. She seems to be trying to escape from her, but it’s a mix up, he really does it to protect her. At that moment the boy seems surprised and scared, he looks towards the street, right on the border where the neon light loses its intensity and the shadows begin, where there is a burly man with a menacing appearance. Ponytailed, hat and trench coat, his eyes emit a mechanical, predatory glow, and in his hands he holds a high-tech repeating submachine gun. He notes that he is looking for them and that he has found them”.

(Traducción del Google :rofl:)

En Stable Diffusion (al menos en local) se pueden meter incluso más palabras, pero eso da igual…

Varios consejos:

  • Aprende a resumir, a simplificar, y a evitar información innecesaria :joy:

  • Como la escena es tan compleja y tan concreta es mejor empezar por una sola cosa, como por ejemplo el escenario y la ambientación, o los personajes (incluso uno a uno), y luego utilizar algo como IvokeAI para modificar o añadir otros elementos que quieras a la escena, o ampliar el escenario, etc (el vídeo de InvokaAI que puse es un buen ejemplo). Además así tienes más control sobre la composición de la escena.

Pero macho, la escena que describes es demasiado enrevesada y compleja, además de estar descrita de manera un tanto… ¿Poética?.

1 me gusta

A ver, es de un amigo que ya no está y me gustaría mantenerlo lo más fidedigno posible, no es mío el texto :rofl:

Pues habrá que bajárselo entonces. Iré probando a ver qué me sale, sé que está complicado.

De hecho, he pensado en pedir a alguien que me dibuje algo así, pero me da miedo la morterada que me pueden pedir.

1 me gusta

Mírate los videos que puse, dan una buena idea de como utilizar y aprovechar InvokeAI.

1 me gusta

Otra idea que he empezado a trastear es el img2img, meto una imagen en paint de lo que quiero y luego le meto el prompt, así me ahorra tiempo dibujando exactamente lo que yo quiero, aunque todavía no llega exactamente lo que le pido

1 me gusta

¿Pide mucho PC esto?

Depende sobre todo de la gráfica que tengas, cuanta más potencia más rapido hará los renders. Yo con una 1070 ya voy bien

1 me gusta

Dejo una actualización con una par de extensiones bastante útiles.

La primera para generar un gif pasado por un estilo de la IA…



La utiliza ChatGP3 y sirve para modificar la imagen tan solo con texto…


1 me gusta