Llama 3.1 405b de Meta AI es un éxito que ha logrado impresionar a muchos usuarios. El nuevo modelo no es un pez pequeño: es un pez grande en un grupo de modelos de lenguaje en constante crecimiento. Echemos un vistazo a la IA que hace que todos hablen y escriban.
Llama 3.1 405b de Meta AI es, como sugiere su nombre, un gran modelo de lenguaje con 405 mil millones de parámetros. Forma parte de la serie Llama 3 de Meta, que se lanzará en abril de 2024. Los primeros puntos de referencia sugieren que este modelo podría superar a los líderes actuales en varias pruebas de IA clave.
Un caballo de otro color: especificaciones de Llama 3.1 405b de Meta AI
Meta AI, anteriormente conocida como Facebook AI Research, es la división de investigación de inteligencia artificial de Meta Platforms. En 2023, presentaron Llama (Large Language Model Meta AI) como una alternativa de código abierto a los modelos de lenguaje propietarios. Llama ganó popularidad rápidamente en la comunidad de IA. Sobre la base de este éxito, Meta lanzó Llama 2 en 2023, que mostró mejoras significativas.
Ahora, con Llama 3, Meta ha superado los límites aún más, y ha culminado con el potente modelo Llama 3.1 405b del que estamos hablando hoy. Esta rápida progresión demuestra el compromiso de Meta con el avance de la tecnología de inteligencia artificial de código abierto.
En esta era en la que la inteligencia artificial está por todas partes, las empresas no se detienen. En una era en la que observamos los gráficos de los juegos antiguos y nos preguntamos cuánto más se puede mejorar, hemos llegado a perdonar los gráficos nuevos, y lo mismo ocurre con la inteligencia artificial.
Meta AI no se queda atrás en lo que se refiere al rendimiento. Este modelo tiene 405 mil millones de parámetros, lo que lo convierte en un peso pesado en el campo de la IA. Entonces, ¿qué significa este parámetro 405b?
Los vecinos nunca dicen nada: Llama 3.1 405b de Meta AI frente a sus competidores
Llama 3.1 405b de Meta AI está mostrando resultados impresionantes en las primeras pruebas comparativas. Supera a GPT-4 en varias pruebas, incluidas GSM8K, Hellaswag, Boolq y varias categorías de MMLU. Sin embargo, se queda atrás en áreas como HumanEval y ciencias sociales de MMLU.
El rendimiento del modelo es particularmente bueno en tareas de matemáticas y codificación. Por ejemplo, en la prueba GSM8K, el Llama 3.1 405b de Meta AI obtuvo una puntuación de 96,8, mientras que su homólogo 70B alcanzó 94,8. En HumanEval, el modelo 405B alcanzó 85,3, en comparación con 79,3 para la versión 70B.
Estas cifras se basan en el modelo base. El ajuste de las instrucciones podría mejorar aún más estos resultados. Por lo tanto, podemos decir que estos números representan la potencia de procesamiento; cuanto mayor sea el número, mejor (pero a veces), pero a veces los modelos se ven abrumados por su carga.

Avanzando hacia el futuro: Llama 3.1 405b de Meta AI y la IA de código abierto
El hecho de que el modelo Llama 3.1 405b de Meta AI sea una IA de código abierto y que, por primera vez, un modelo de código abierto pueda superar al mejor LLM de código cerrado disponible en varios puntos de referencia, puede ser una señal de lo que vendrá, aunque no se comprenda completamente en este momento. Por ahora, podemos crear nuestros GPT en ChatGPT. Esta dependencia puede romperse en el futuro.
Llama 3.1 405b de Meta AI es un nuevo y sólido actor en el espacio de la IA. Su sólido desempeño en varios puntos de referencia y su naturaleza de código abierto lo convierten en un modelo a tener en cuenta. A medida que la IA continúa evolucionando, Llama 3.1 405b de Meta AI puede desempeñar un papel importante en la configuración del futuro de los modelos de lenguaje y la tecnología de IA.
Crédito de la imagen destacada: Meta AI Blog
Source: Llama 3.1 405b de Meta AI alcanza los puntos de referencia





