Se presentó la versión más potente del algoritmo principal de texto a imagen de Stability AI, SDXL 1.0. Consume menos recursos de procesamiento, produce imágenes con una resolución más alta que la versión 0.9 y realiza menos consultas de texto. ¡Es más útil y eficiente que nunca con Stable Diffusion XL 1.0!
Las herramientas de inteligencia artificial, como ChatGPT, no solo producen texto. Ahora pueden producir una variedad de medios, que incluyen música, películas e imágenes. Cualquiera puede hacer prácticamente cualquier imagen con el programa de IA Stable Diffusion. La utilización de SD y herramientas comparables, que ya se utilizan ampliamente, mejorará considerablemente con las actualizaciones.
“Con SDXL 1.0, ajustar el modelo a datos personalizados es más fácil que nunca. Se pueden generar puntos de control o LoRA personalizados con menos necesidad de disputas de datos. El equipo de Stability AI está construyendo la próxima generación de controles de estructura, estilo y composición específicos de tareas, con T2I / ControlNet especializado para SDXL. Estas funciones se encuentran actualmente en versión preliminar beta, pero estén atentos a las actualizaciones sobre ajustes”, anunció Stability AI.
Características SDXL 1.0
Los clientes ahora pueden especializarse en generar personas o cosas específicas con solo cinco imágenes, gracias a una nueva capacidad beta de ajuste fino. Esta utilidad utiliza una pequeña cantidad de fotos para pulir SDXL 1.0.
SDXL 1.0, uno de los modelos de imágenes de acceso abierto más eficaces que existen actualmente en el mercado, tiene una canalización de conjunto de modelos de 6600 millones de parámetros y un modelo base de 3500 millones de parámetros. Puede probar el modelo de forma gratuita utilizando Clipdrop de Stability.ai.
Mejore sus imágenes con la nueva Stability AI SDXL 0.9
El modelo completo para la difusión latente es una tubería de diferentes expertos: en la primera fase, el modelo base genera pacientes (ruidosos), que luego son procesados por un modelo de refinamiento hecho especialmente para los pasos finales de eliminación de ruido. No olvide que el modelo base se puede usar de forma independiente como un módulo.
Esta arquitectura de dos etapas permite la resiliencia de la generación de imágenes sin perder velocidad ni requerir recursos de CPU excesivos. SDXL 1.0 debería funcionar de manera efectiva en GPU de consumo con 8 GB de VRAM o instancias en la nube ampliamente accesibles.
“SDXL genera imágenes de alta calidad en prácticamente cualquier estilo artístico y es el mejor modelo abierto para el fotorrealismo. Se pueden generar distintas imágenes sin que el modelo imparta ninguna “sensación” particular, lo que garantiza una absoluta libertad de estilo. SDXL 1.0 está particularmente bien ajustado para colores vibrantes y precisos, con mejor contraste, iluminación y sombras que su predecesor, todo en una resolución nativa de 1024×1024”, dijo Stability AI en la publicación del blog.
Se lanza la IA de estabilidad garabato estable que permite la generación de boceto a imagen
Cómo usar SDXL 1.0 en diferentes plataformas
Se puede acceder al modelo a través de Stability AI API, la página de GitHub y sus aplicaciones de consumo Clipdrop y DreamStudio. También se puede encontrar en Amazon SageMaker JumpStart, un centro de ML donde los usuarios pueden obtener soluciones, modelos y algoritmos de ML.
El lanzamiento de SDXL 1.0 se produjo después del lanzamiento de SDXL 0.9 solo para investigación en julio. Supuestamente, la compañía alteró el modelo para producir colores que son más fieles al color y deslumbrantes, así como contraste, iluminación y sombras mejorados. El proceso de creación de imágenes también se ha mejorado para generar imágenes de resolución completa de 1 megapíxel (1024 x 1024) en una variedad de relaciones de aspecto más rápidamente.
A continuación se enumeran algunos de los enlaces que necesitará para usar Stable Diffusion XL 1.0. Para comenzar con SDXL 1.0, consulte estas diferentes plataformas:
- Clipdrop
- GitHub
- API de IA de estabilidad
- Sagemaker de AWS
- Base de AWS
- Discordia de la fundación estable
- estudio de ensueño
Debido a su naturaleza de código abierto, SDXL tiene aún más capacidades y potencial que Midjourney, aunque su uso efectivo requiere un poco más de esfuerzo. Quizás el único modelo de imagen disponible en el mercado que iguala el grado de calidad de Midjourney en términos de calidad es SDXL.
Crédito de la imagen destacada: Estabilidad AI