Inteligencia artificial y el futuro del arte

¿De qué forma cambiarán el mercado del arte las inteligencias artificiales como dalle2 y stable diffusion?

Inteligencia artificial y el futuro del arte

Este post se lanzó originalmente en Octubre de 2022 y lo lancé para los suscriptores de paga. Es sorprendente lo mucho que ha cambiado ya la industria y los modelos de inteligencia artificial en tan poco tiempo. Esta semana se lanzó ChatGPT, una herramienta que permite hablar con la inteligencia artificial como si fuera una persona.

También en estas semanas hubo una actualización de Dall-e 2 y de Stable Diffusion que eliminan las restricciones que mencioné en este post y permiten hacer animales antropomorfos. El tamaño del crecimiento de este mercado es una apuesta que viene de la gran utilidad que hay en ella.


Ya es posible escribir un texto a una inteligencia artificial y recibir a cambio una imagen con aquello que le describiste. El mercado del arte no volverá a ser lo mismo.

Hay varios motores de arte con inteligencia artificial ya en el mercado. Los dos más importantes son Dall-e y Stable Diffusion. He probado los dos y son en realidad muy similares.

Básicamente lo que hacen estos modelos es que se alimentan de millones de imágenes y “aprenden” lo que significan las palabras que las describen. El modelo no sólo aprende de los temas en la imagen, también se alimenta de múltiples estilos. Por ejemplo, aquí tienes a un gato al estilo de Van Gogh.

Hay ya mucha discusión sobre cómo funcionan y lo disruptivos que pueden ser. Hablemos de la economía y del futuro del arte ante estas herramientas.

🧑🏽‍🎨Cómo funciona

Los modelos que hacen posible el arte a partir de texto se conocen como Inteligencia Artificial Generativa. No es precisamente una tecnología nueva, pero los modelos entrenados y la facilidad de uso han sido lo que ha cambiado recientemente. Es lo que cambiará el mercado del arte.

La tecnología que usan dall-e y Stable Difussion es la misma que se usa para crear fotos de personas que no existenusando millones de fotografías. La idea es tomar todas esas fotos y agregar algo de ruido aleatorio, sólo para pedirle que una red neuronal reconstruya la imagen.

En el proceso de reconstrucción sale algo completamente nuevo. Esto quiere decir que los errores se aprovechan. Como ejemplo, mira este uso de este tipo de redes neuronales en el que se le proporciona a una inteligencia artificial la cara de Obama y se le pide que la reconstruya. El resultado es una cara blanca, muy diferente a lo que sabemos que es la real. Esto sucede porque la inteligencia artificial tiene sesgos respecto a cómo se ven las caras con esas características cuando se pixelean de esta manera.

Estos modelos ya se están aplicando en aplicaciones de comunicación remota y de video y fotografía. Por ejemplo, NVIDIA está usando inteligencia artificial para mejorar la calidad del video en las videollamadas. De esta manera al hacer una videollamada, la calidad que estás viendo en tu imagen es mucho mejor que la que puede procesar tu teléfono. Tu no te estás dando cuenta, pero eso hace que mejores tu experiencia sin que eso signifique mayor costo al comprar tus chips.

🎨Cómo cambiará el arte

Ya hay furor y discusión sobre el futuro del arte que causarán estas herramientas. He usado ya las dos herramientas y lo he hecho por medio de las plataformas y usando scripts de código abierto para uso gratuito y quiero aclarar algunas cosas respecto a estas herramientas.

No es magia

Por mucho que lo promocionen como un medio mágico para dibujar lo que desees, hay algunas limitantes al momento de usar estos modelos.

No me refiero a lo que cuestan, que es justamente lo que cambia. Me refiero a las habilidades que se requiere desarrollar para empezar a trabajarlo. La primera vez que abrí dalle-2 para pedirle una imagen los resultados… no fueron lo que esperaba.

Por alguna razón me imaginé que si solo le pedía a un mono lanzando dardos para seleccionar acciones en la bolsa de valores, la inteligencia artificial iba a interpretar el subtexto.

Se necesita desarrollar una habilidad particular para redactar de tal manera que la inteligencia artificial te entregue algo más parecido a lo que buscas. Al conjunto de técnicas que se usan actualmente se les llama prompt engineering(ingeniería de comandos)

Entre más específicos sean los comandos que se mandan a la inteligencia artificial, mejores serán los resultados. Pero esto requiere conocer sobre diferentes estilos y técnicas de dibujo. Esto significa que las personas que tienen ya una educación en arte tienen una ventaja. Hay servicios de búsqueda de imágenes generadas por inteligencia artificial para darle en parte la vuelta a esto, pero ayuda en mucho saber lo que estás haciendo.

Hay otra complicación: las imágenes que se usan para entrenar las redes neuronales tienen sesgos. Los modelos se alimentan de imágenes de arte existente, por lo que si deseas pedirle algo que no está dentro de sus parámetros los resultados pueden ser extraños. Por ejemplo, en algún momento estaba platicando con mi hijo sobre sus playeras de dinosaurios y se nos ocurrió pedir una imagen de un dinosaurio con una playera de niño. No supe darle bien la instrucción, pues estos fueron los resultados (no hablemos de que no le di instrucciones del estilo que buscaba).

Cuando se trata de dinosaurios, puedo imaginar que las ilustraciones de las que el modelo se alimentó varían mucho. De hecho fue muy difícil pedirle imágenes de stegosaurus o de pterodáctilos. Pero también es necesario tener mucho ingenio para hacer representaciones de algo abstracto.

Estos fueron mis intentos de representar una persona bailando en medio de una recesión para el artículo sobre las canciones de la recesión. Cómo puedes notar, las caras humanas no son el fuerte de estos modelos. Tardé en encontrar que debía pedir un retrato para que la inteligencia artificial hiciera caras que si parezcan caras.


¡Genial! Te has registrado exitosamente.

¡Bienvenido de vuelta! Has iniciado sesión correctamente.

Te has suscrito correctamente a Escribe tu primer paper de Economía.

¡Éxito! Revisa tu correo electrónico para obtener el enlace mágico para iniciar sesión.

¡Éxito! Se ha actualizado la información de facturación.

No se actualizó tu información de facturación.

Sígueme en Mastodon