Apple sigue trabajando en la inteligencia artificial a todo vapor. Finalmente, lanzó una nueva serie de modelos de inteligencia artificial de código abierto llamado OpenELM (.
Con el objetivo de ofrecer a los usuarios el poder y las funciones de la inteligencia artificial sin necesidad de servidores en la nube, Apple afirma que la característica más importante de estos modelos es que pueden funcionar en el dispositivo.
Mientras tanto, recientemente compartimos con ustedes las declaraciones y detalles de Mark Gurman de Bloomberg sobre AI LLM en iOS 18. Aquí está todo lo que sabemos sobre los nuevos modelos de inteligencia artificial.
¿Qué es OpenELM?
OpenELM consta de ocho modelos. Cuatro están preentrenados, mientras que otros se pueden personalizar con instrucciones y entradas específicas. Los modelos son relativamente pequeños (de 270 millones a 3 mil millones de parámetros) y están optimizados para ejecutarse en dispositivos.
Apple utiliza una estrategia de escalado basada en capas para mejorar la precisión y eficiencia de los modelos.
Por otro lado, el uso de modelos OpenELM ofrece muchas ventajas.:
- Procesamiento de IA en el dispositivo: Con los modelos OpenELM, las funciones de IA se pueden realizar directamente en el dispositivo sin necesidad de servidores en la nube. Esto aumenta significativamente tanto la privacidad como la seguridad de los datos.
- Costos mas bajos: La menor dependencia de los servidores en la nube genera ahorros de costos.
- Tiempos de respuesta más rápidos: El procesamiento de datos en el dispositivo permite tiempos de respuesta más rápidos y una experiencia de usuario más fluida.
- Más investigación y desarrollo: Los modelos OpenELM son de código abierto, lo que permite a investigadores y desarrolladores estudiarlos y mejorarlos. Esto acelera el avance de la tecnología de inteligencia artificial y el desarrollo de aplicaciones de próxima generación.
Apple hizo la siguiente declaración sobre los nuevos modelos de lenguaje:
La reproducibilidad y transparencia de los grandes modelos lingüísticos son cruciales para promover la investigación abierta, garantizar la confiabilidad de los resultados y permitir investigaciones sobre los sesgos de los datos y los modelos, así como los riesgos potenciales. Con este fin, lanzamos OpenELM, un modelo de lenguaje abierto de última generación. OpenELM utiliza una estrategia de escalamiento por capas para asignar parámetros de manera eficiente dentro de cada capa del modelo del transformador, lo que lleva a una mayor precisión. Por ejemplo, con un presupuesto de parámetros de aproximadamente mil millones de parámetros, OpenELM muestra una mejora del 2,36 % en la precisión en comparación con OLMo y requiere 2 veces menos tokens de preentrenamiento.
A diferencia de las prácticas anteriores que solo proporcionan pesos de modelo y código de inferencia, y entrenan previamente en conjuntos de datos privados, nuestra versión incluye el marco completo para entrenar y evaluar el modelo de lenguaje en conjuntos de datos disponibles públicamente, incluidos registros de entrenamiento, múltiples puntos de control y entrenamiento previo. configuraciones. También publicamos código para convertir modelos a la biblioteca MLX para inferencia y ajuste en dispositivos Apple. Esta versión integral tiene como objetivo empoderar y fortalecer la comunidad de investigación abierta, allanando el camino para futuros esfuerzos de investigación abierta.
Además, si quieres saber más sobre OpenELM, puedes consultar este informe detallado.
Los planes de Apple incluyen hacer que los modelos OpenELM estén disponibles en el sistema operativo iOS 18. Se espera que iOS 18 incluya mejoras significativas centradas en la IA y ejecute un modelo de lenguaje grande (LLM) en el dispositivo.
Los modelos OpenELM se consideran un paso importante para el futuro de la inteligencia artificial. Con los nuevos modelos, se espera que la IA sea más privada, segura y accesible.
La medida de Apple podría ser importante para difundir la inteligencia artificial e integrarla en todos los aspectos de la vida diaria.
Crédito de la imagen destacada: Keming Tan / Unsplash
Source: Apple lanza una nueva serie de modelos de IA de código abierto llamada OpenELM