Meta, el gigante tecnológico conocido por dar forma al metaverso, ha presentado recientemente un avance notable en inteligencia artificial: Emu AI, abreviatura de Universo de medios expresivos.
Este modelo de IA de vanguardia está preparado para revolucionar el proceso de generación de imágenes a partir de descripciones textuales.

Ajuste de calidad con Emu AI
En el corazón del ingenio de Emu se encuentra una técnica conocida como “Ajuste de calidad”. Este enfoque innovador mejora drásticamenteEs el atractivo visual de las imágenes producidas por modelos de texto a imagen de IA. Los resultados no sólo son visualmente impactantes sino también notablemente fieles al texto proporcionado.
En su extenso esfuerzo de investigación, el equipo de IA de Meta se embarcó en un viaje que comenzó con el preentrenamiento de un modelo de difusión latente. Esta fase inicial implicó un conjunto de datos colosal que comprende la asombrosa cifra de 1.100 millones de pares de imágenes y texto. Sin embargo, el verdadero avance surgió durante la etapa de ajuste, donde el sistema fue entrenado en una selección curada de sólo 2000 imágenes de alta calidad meticulosamente elegidas.
Fusionando tecnología con experiencia humana
Este proceso, descrito como encontrar “agujas fotogénicas en un pajar” combina tecnología de punta con el indispensable toque humano. El conjunto de datos inicial fue amplio y capturó miles de millones de imágenes. Sin embargo, fue a través una serie de filtros automáticos que este tesoro de imágenes fue refinado. Factores como contenido ofensivo, alineación imagen-texto, y superposición de texto fueron examinados. Sin embargo, las limitaciones del filtrado automatizado eran evidentes, lo que lleva a la inclusión crítica de anotadores humanos.
Los anotadores, desde generalistas hasta especialistas, jugaron un papel fundamental en el proceso de selección. Sus ojos perspicaces aseguraron que sólo la crème de la crème –las imágenes que trascendieron ‘bien’ conseguir ‘excepcional’ estado – hizo el corte final. Al final, sólo quedaron 2000 imágenes, cada uno posee un atractivo innegable.

Un apodo de distinción
La elección de ‘Emu’ como apodo para este modelo innovador es simbólico. Se rinde homenaje a la emú, un ave conocida por su naturaleza distintiva y llamativa. Esta elección refleja la capacidad de Emu para captar la atención y destacan en el ámbito de la generación de imágenes.
El triunfo de Emu AI sobre lo último en tecnología
La destreza de Emu AI se extiende más allá del ámbito de los entornos fotorrealistas, ya que sobresale incluso en generando bocetos y caricaturas. Evaluaciones comparativas contra el modelo SDXL1.0 de última generación arrojó resultados notables. Emu surgió como la opción preferida, con una importante Tasa de preferencia del 68,4% para atractivo visual en el punto de referencia PartiPrompts, y un resultado aún más impresionante Tasa de preferencia del 71,3% en su punto de referencia Open User Input.
Los investigadores de Meta atribuyen el rendimiento excepcional de Emu no sólo a la arquitectura del modelo sino también, fundamentalmente, a la calidad y diversidad de los datos utilizados para el ajuste. Sorprendentemente, el impacto de tan solo 100 imágenes de entrenamiento de alta calidad sobre las capacidades de generación de Emu AI fue sustancial. Esto subraya la potencia de un conjunto selecto de ejemplos ejemplares para alinear la creatividad de la IA con la estética humana.
El arte multifacético de Emu
Una de las características más loables de Emu es su versatilidad. Demuestra la capacidad de representar una amplia gama de conceptos, que van desde retratos a paisajes amplios y Incluso el arte abstracto. Esta versatilidad posiciona a Emu como una poderosa herramienta para artistas, diseñadores, y creadores en un espectro de disciplinas visuales.

Pioneros en el futuro de la creatividad impulsada por la IA
Emú representa un salto significativo para Meta hacia una IA que pueda fácilmente transformar ideas en contenido visualmente cautivador. Sirve como testimonio del valor de una selección meticulosa de los conjuntos de datos de aprendizaje automático. Además, proporciona una tentadora visión de un futuro en el que el texto por sí solo puede ser suficiente para materializar nuestras visiones imaginativas.
Pronto se podrá acceder a la funcionalidad de Emu a través del chatbot Meta AI, que promete democratizar la creación de contenido visualmente impactante en una gran variedad de aplicaciones y dispositivos.
Crédito de la imagen destacada: Meta
Source: Emu AI se une a la carrera GenAI, de manera bastante espectacular





