La creación de imágenes mediante la descripción de texto se está poniendo muy de moda. Si no eres un buen dibujante pero necesitas una ilustración con urgencia, ahora mismo hay bastantes vías para dar con la solución a ese problema. Hace unas semanas os hablábamos de DALL-E 2, una IA impresionante capaz de dibujar cualquier cosa que se le pida por escrito. Solamente hace falta descubrir lo que queremos para que la inteligencia artificial se encargue del resto. Es como si fuera algún tipo de brujería, vaya.
Ahora ha aparecido una nueva IA creada por Google que, según parece, es capaz de superar a DALL-E 2. No con mucha diferencia, todo sea dicho, pero sí que es capaz de leer mejor las instrucciones para que el resultado sea mucho más preciso. Además que la calidad del dibujo, según cómo se mire, también es algo superior. Bajo el nombre de 'Imagen', esta inteligencia artificial puede dibujar todo lo que le pidamos. Hasta puede contarnos chistes. Esta IA en particular se basa en modelos lingüísticos para comprender correctamente el texto y emplea modelos de difusión para dar vida a esas imágenes.
¿Se acaba de comer IMAGEN a DALL-E 2?
Para comprobar que los modelos de calidad son los adecuados se ha creado a DrawBench, que permite comprar las imágenes de esta web en cuestión con las de DALL-E 2, por ejemplo, para corroborar que se ha dado en el clavo con ello. Jeff Dean, investigador senior de inteligencia artificial de IA Google, ha compartido algunas de las fotografías creadas a través de 'Imagen' para que podamos hacernos una idea de la calidad del producto:
"Un retrato de alto contraste de un panda peludo muy feliz vestido como un chef en una cocina de alto nivel haciendo masa. Hay una pintura de flores en la pared detrás de él", dice la descripción de la imagen que vemos en el tweet.