OpenAI anuncia ahora la integración de la API DALL-E. Los desarrolladores podrán utilizar DALL-E directamente en sus aplicaciones a través de esta nueva API.
El acceso a la API DALL-E ahora está en la versión beta pública
Como ya sabrá, ¡el acceso a DALL-E 2 se ha puesto a disposición de todos últimamente! Sin embargo, con este nuevo anuncio, GPT-3, Embeddings y Codex ahora se unen a DALL-E, un modelo de lenguaje transformador que permite a los usuarios emplear indicaciones de lenguaje natural para generar y modificar imágenes originales.
“Más de 3 millones de personas ya utilizan DALL·E para ampliar su creatividad y acelerar sus flujos de trabajo, generando más de 4 millones de imágenes al día. Los desarrolladores pueden comenzar a construir con esta misma tecnología en cuestión de minutos”, afirmó OpenAI.
Compartieron este código y la imagen de salida como ejemplo:
- La salida:
¿Qué ofrece DALL-E API para desarrolladores?
Debido a la versatilidad de DALL-E, los usuarios pueden producir y modificar imágenes únicas que van desde creativas hasta fotorrealistas. DALL-E es excelente para ejecutar instrucciones en lenguaje natural, lo que permite a los usuarios especificar con precisión lo que desean ver. A medida que avanza la investigación de OpenAI, seguirán actualizando la API para reflejar los desarrollos más avanzados en calidad de imagen, latencia, escalabilidad y usabilidad.
Moderación incorporada
Los desarrolladores pueden enviar sus aplicaciones con confianza, sabiendo que las mitigaciones integradas, como filtros para símbolos de odio y gore, manejarán los aspectos difíciles de la moderación al incorporar las lecciones de confianza y seguridad que obtuvimos al distribuir DALL-E a 3 millones de artistas y usuarios a nivel mundial. Como parte de nuestra dedicación a la implementación responsable en OpenAI, seguiremos priorizando la confianza y la seguridad para que los desarrolladores puedan concentrarse en crear.
Aplicaciones DALL-E
OpenAI colaboró estrechamente con un grupo selecto de primeros usuarios que ya integraron DALL-E en una variedad de aplicaciones y productos.
Microsoft está integrando DALL-E API en Designer, una nueva herramienta de diseño gráfico que permite a los usuarios crear invitaciones, imágenes, postales digitales, publicaciones en redes sociales y más de manera profesional.
Además, Microsoft está integrando la API DALL-E en Bing y Microsoft Edge con Image Creator, lo que permite a los usuarios crear imágenes en caso de que los resultados web no proporcionen lo que están buscando.
El primer sistema operativo de moda y estilo de vida del mundo se llama CALA. Desde la concepción del producto hasta la habilitación del comercio electrónico y el cumplimiento de pedidos, CALA unifica todo el proceso de diseño en una única plataforma digital. Los usuarios pueden crear nuevos conceptos de diseño a partir de fotografías de referencia enviadas o descripciones en lenguaje natural utilizando las nuevas tecnologías de inteligencia artificial de CALA impulsadas por DALL-E API.
Una startup de fotografía en rápida expansión llamada Mixtiles también está utilizando DALL-E API. Millones de personas pueden hacer impresionantes paredes de fotos con su ayuda gracias al software y un proceso fácil de colgar. Al guiar a las personas a través de un proceso creativo que captura recuerdos tempranos, lugares de fantasía y más, Mixtiles emplea la API DALL-E para generar y enmarcar obras de arte emocionalmente resonantes.
“Estamos emocionados de ver qué harán nuestros clientes con DALL·E y qué ideas creativas se les ocurrirán”, dijo OpenAI en el comunicado.
Precios de la API de DALL-E
El tamaño de la imagen de salida determina el precio de la API DALL-E. Si bien hay pequeños descuentos para 512 x 512 a $0,018/Imagen y 256 x 256 a $0,016/Imagen, 1024 x 1024 cuesta $0,02/Imagen.
Luke Miller, gerente de producto de OpenAI, le dijo a VentureBeat que la API tiene tres funciones. Los usuarios pueden crear una imagen, modificar una parte y crear numerosas versiones de la misma imagen.
“Puede pensar en ello como algo similar al proceso creativo, generar ideas, elegir algo y reducirlo y luego continuar iterando y encontrar algo que se adapte a sus necesidades y al contexto dado”, afirmó.
Según Rowan Curran, experto en IA y ML de Forrester Research, será “tremendamente útil” para los desarrolladores si la API DALL-E permite la edición y mejora de imágenes.
En el pasado, Curran señaló el costo asociado con el mantenimiento de modelos de lenguaje grande como una de sus limitaciones generales. Por lo tanto, dijo que la API DALL-E “abriría un conjunto completo de casos de uso, especialmente para nuevas empresas y personas que reciben financiación inicial”.
Documentación de la API de DALL-E
Los desarrolladores pueden leer toda la documentación que explica la API DALL-E usando este enlace. Cuando DALL-E 2 introdujo la pintura externa, estábamos muy emocionados. Esperamos ver los efectos de este nuevo salto de OpenAI.
Source: OpenAI anuncia ahora la versión beta pública de la API de DALL-E