1. Ir al contenido
  2. Ir al menú principal
  3. Ir a más sitios de DW

DALL-E: IA es capaz de generar imágenes a partir de un texto

11 de abril de 2022

Esta ingeniosa IA es capaz de generar imágenes a partir de los atributos descritos por un usuario: ya sea un astronauta montando a caballo" o "una tetera con forma de aguacate", DALL-E 2 parece ser capaz de todo.

https://p.dw.com/p/49njR
DALL-E 2 puede editar imágenes y cambiar su composición, sombras, reflejos y texturas sobre la marcha.
DALL-E 2 puede editar imágenes y cambiar su composición, sombras, reflejos y texturas sobre la marcha. Imagen: OpenAI

La empresa de inteligencia artificial OpenAI ha lanzado su última creación, llamada DALL-E 2, una red neuronal que genera complejas imágenes a partir de texto. En enero de 2021, la empresa ya había creado la versión predecesora DALL-E. Ahora, con la versión más avanzada, el sistema ofrece composiciones más realistas y en mayor resolución.

"DALL-E 2 es un nuevo sistema de IA que puede crear imágenes y arte realistas a partir de una descripción en lenguaje natural", según se lee en el sitio web de OpenAI.

El sitio web da muchos ejemplos de los trabajos del sistema de IA y son nada menos que impresionantes. Y es que el sistema puede convertir simples descripciones de texto en imágenes fotorrealistas.

DALL-E 2 puede editar imágenes y cambiar su composición, sombras, reflejos y texturas sobre la marcha. Incluso puede combinar conceptos totalmente extraños. Por ejemplo, las palabras "un astronauta" "montando a caballo" y "en un estilo fotorrealista", o "un escaparate de una floristería" con "una fachada verde pastel y blanco limpio" y "una puerta abierta" fueron suficientes para que DALL-E 2 produjera imágenes bastante elaboradas.

Otro ejemplo, quizás aún más específico, que dio a conocer la empresa fue: "Macrofotografía de película de 35 mm de una gran familia de ratones con sombreros acogidos junto a la chimenea".

DALL-E 2 es capaz de múltiples variaciones

Según OpenAI, además de crear las imágenes, "DALL-E 2 puede tomar una imagen y crear diferentes variaciones de la misma inspiradas en el original". Esto se ilustra con un cuadro que se hace ligeramente diferente con cada versión sin dejar de ser fiel a las características generales del cuadro.

Fusionando los nombres del robot WALL-E y del artista Salvador Dalí, DALL-E2 funciona gracias a un proceso llamado "difusión". Básicamente, el sistema reorganiza un patrón aleatorio de puntos en una imagen a medida que reconoce aspectos específicos de la figura.

Alex Nichol, uno de los investigadores a cargo del desarrollo de DALL-E 2, mostró a The New York Times, una demostración. Cuando tecleó "una tetera con forma de aguacate", la inteligencia artificial produjo diez imágenes diferentes de una "tetera de aguacate", con y sin hueso.

DALL-E 2: a disposición de un "grupo selecto de usuarios"

La herramienta, que aún no se comparte con el público, se está poniendo a disposición de un "grupo selecto de usuarios" a través de una lista de espera.

OpenAI planea ofrecer finalmente la tecnología a la comunidad creativa, para que personas como los diseñadores gráficos puedan utilizar nuevos atajos al desarrollar imágenes digitales, según The New York Times.

"DALL-E 2 puede tomar una imagen y crear diferentes variaciones de la misma inspiradas en la original".
"DALL-E 2 puede tomar una imagen y crear diferentes variaciones de la misma inspiradas en la original".Imagen: OpenAI

De acuerdo con The Smithsonian Magazine, para evitar posibles daños, OpenAI ha publicado una política de usuario que prohíbe pedir al sistema que produzca imágenes ofensivas, como violencia, pornografía o mensajes de temática política.

"Esperamos que herramientas como ésta democraticen la capacidad de la gente para crear lo que quiera", dice Nichol a Fortune.

Editado por Felipe Espinosa Wang.