Mon. Oct 3rd, 2022

OpenAI ha agregado una nueva función de “outpointing” a su modelo de AI de texto a imagen DALL-E que permite que el sistema genere nuevas imágenes que expanden los bordes de cualquier imagen dada. En el ejemplo anterior, puede ver cómo DALL-E, con la ayuda de indicaciones humanas, “imagina” lo que está fuera del marco del retrato “La joven de la perla” de Johannes Vermeer. Tenga en cuenta cómo, incluso a partir de la información limitada proporcionada por el retrato, el sistema puede igualar el estilo de Vermeer, imitando las sombras y los reflejos del original. En el lapso de tiempo a continuación, también puede ver cómo el artista responsable, August Kamp, tuvo que expandir la imagen en pequeñas secciones a la vez, a menudo rehaciendo las generaciones de DALL-E para obtener el resultado que ella quería. No se ve en este video, pero definitivamente vale la pena resaltar, el hecho de que el sistema no genera estas extensiones solo. Al igual que con toda la IA de texto a imagen, el modelo requiere que los humanos describan las nuevas imágenes. La función de pintura exterior se puede utilizar para expandir el contenido original, pero, por supuesto, muchos usuarios de DALL-E han estado jugando con la función para ver qué hay fuera del marco de las imágenes famosas. (Desplácese hacia abajo para ver mi ejemplo favorito absoluto…) Desde una perspectiva más amplia, la pintura no amplía realmente la funcionalidad básica de los sistemas de IA de texto a imagen, pero muestra cómo OpenAI probablemente se posicionará en el mercado creciente para estos sistemas: haciendo de la facilidad de uso un argumento clave para los clientes. Muchos modelos de IA de texto a imagen pueden realizar la misma función esencial que la pintura exterior, pero, al igual que DALL-E antes de esta actualización, requería bastante manipulación manual. Hacer que pintar sea lo más fácil posible ayudará a DALL-E a diferenciarse de la creciente competencia de sistemas más pequeños pero comparables como Midjourney y Stable Diffusion. DALL-E en sí mismo ahora está disponible a través de un programa beta, con más de un millón de usuarios actualmente con acceso. Cada usuario beta obtiene 50 generaciones de imágenes gratis en el primer mes, luego 15 usos adicionales cada mes después. Luego pueden comprar 115 generaciones de imágenes adicionales por $15. Mientras tanto, sin embargo, la pintura exterior se puede usar para responder algunos de los misterios más grandes de la vida, como “¿y si el chico de Quaker Oats fuera una camarera tetona?” Extrañar más: