El sistema de inteligencia artificial conocido como Google Muse AI se presentó oficialmente hoy. Basado en su uso de decodificación paralela y un espacio latente pequeño y discreto, el nuevo modelo de transformador de texto a imagen afirma ser más rápido que las alternativas existentes. Los creadores de Google Muse AI afirman que su creación puede generar fotografías a un nivel de calidad comparable al mejor de los mejores.
Nosotros presentamos Musaun modelo de transformación de texto a imagen que logra un rendimiento de generación de imágenes de última generación y es significativamente más eficiente que los modelos autorregresivos o de difusión.
Equipo de IA de Google Muse
¿Qué es la IA de Google Muse?
El equipo afirma que Google Muse AI es una gran mejora con respecto a los modelos transformadores de texto a imagen anteriores como Imagen y DALL-E 2. Muse utiliza la incrustación de texto de un modelo de lenguaje grande para ser entrenado en un trabajo de modelado enmascarado en un espacio de token discreto (LLM ).

Muse es capaz de reconocer fichas en imágenes que se han disfrazado a voluntad. Debido al uso de tokens discretos y a la reducción de los requisitos de tamaño de muestra, Muse promete superar a los modelos de difusión de espacio de píxeles como Imagen y DALL-E 2. El modelo genera una edición gratuita sin disparos y sin máscara al volver a muestrear repetidamente tokens de imagen en respuesta. a un aviso.
Según los puntos de referencia de MUSE, los tiempos de inferencia de Muse son significativamente más bajos que los de los modelos de la competencia.
| Modelo | Resolución | Tiempo de inferencia (↓) |
| Difusión estable 1.4 | 512×512 | 3.7s |
| Parti-3B | 256×256 | 6.4s |
| Imagen | 256×256 | 9.1s |
| Imagen | 1024×1024 | 13,3 s |
| Musa-3B | 256×256 | 0.5s |
| Musa-3B | 512×512 | 1,3 s |
A diferencia de Parti y otros modelos autorregresivos, Muse aprovecha la decodificación paralela. Para producir imágenes de alta calidad y reconocer conceptos visuales como objetos, sus relaciones espaciales, postura, cardinalidad, etc., un LLM que ya se ha enseñado debe entender inglés en un nivel granular. No es necesario voltear el modelo para que Muse admita la edición sin máscara, pintura interna y externa.

Funciones de IA de Google Muse
Muse es un modelo rápido y de vanguardia para generar y modificar imágenes a partir de texto, y tiene varias características útiles, que incluyen:
- Generación de texto a imagen
- En reacción a las entradas de texto, Muse, la inteligencia artificial (IA) de Google, genera rápidamente imágenes de alta calidad (1,3 s para una resolución de 512 × 512 o 0,5 s para una resolución de 256 × 256 en TPUv4).

- Edición sin máscara y sin tomas
- El modelo de IA de Google Muse nos brinda una edición gratuita sin máscaras y sin disparos mediante el muestreo repetido de tokens de imágenes en respuesta a una instrucción textual.

- Al modificar una imagen, la edición sin máscara le permite manipular varios objetos con un mensaje de texto simple.

- Repintado/Repintado de tiro cero
- Muse AI de Google es gratuito y viene con funciones de edición basadas en máscaras (repintar y pintar). Al aplicar una máscara a una edición, se vuelve funcionalmente equivalente a una nueva generación.

Echa un vistazo a los mejores generadores de tweets de IA que te ayudarán a twittear como Elon Musk.
Detalles del modelo de IA de Google Muse
Puede consultar el flujo de entrenamiento de Muse AI de Google a continuación:

El equipo de Google utiliza dos redes tokenizadoras VQGAN diferentes, una para fotografías de baja calidad y otra para imágenes de alta resolución. Los transformadores de baja resolución (“base”) y alta resolución (“superres”) se entrenan con los tokens desenmascarados y las incrustaciones de texto T5 para predecir los tokens enmascarados.
Para obtener información más detallada sobre Google Muse AI, haga clic aquí.
Herramientas de IA que hemos explicado
Aunque algunos digan “no a las imágenes generadas por IA”, casi todos los días llega a nuestras vidas una nueva herramienta de IA, como por ejemplo:
- IA preparada
- Caktus IA
- OpenAI Punto-E
- Uberduck IA
- QQ Me Dimensión Diferente
- Máquina del tiempo con IA de MyHeritage
- Cicero AI de Meta
- noción IA
- IA Meta Galáctica
- Novela AI
- Meta IA de Make-A-Video
- DALL-E 2
- Sueño de útero
- La IA DreamBooth de Google
- Difusión estable
¡Mantente sintonizado para más!

