Meta AI: En este post explicaremos qué es llama 2 y cómo usarlo. Meta presentó su modelo de lenguaje grande (LLM) Llama 2 más reciente, que en las pruebas superó a otros modelos de chat de código abierto (incluido GPT) en la mayoría de los puntos de referencia, incluida la utilidad y la seguridad.
Además de publicar tres modelos alternativos como parte del nuevo lanzamiento, uno entrenado en 7 mil millones de parámetros, otro en 13 mil millones y, en última instancia, una versión de 70 mil millones, Meta AI también está poniendo a disposición “Llama 2 Chat”, una variante más refinada. diseñado exclusivamente para casos de uso conversacional.
Este es un logro tecnológico en sí mismo, pero lo que es más intrigante es que Meta y Microsoft también han anunciado un fortalecimiento de su colaboración, lo que permite a los desarrolladores que utilizan las herramientas de Microsoft seleccionar entre los modelos Llama de Meta y GPT de OpenAI al crear experiencias de IA.
Meta AI: ¿Qué es llama 2?
Se ha optimizado la arquitectura transformadora del modelo de lenguaje autorregresivo Llama 2. Se pretende el uso comercial y académico en inglés de Llama 2. Viene en una variedad de variantes preentrenadas y ajustadas, así como tamaños de parámetros que van desde 7 mil millones a 70 mil millones.
Según Meta, las versiones modificadas se adaptan a las preferencias humanas en cuanto a seguridad y utilidad a través de ajustes finos supervisados (SFT) y aprendizaje de refuerzo con retroalimentación humana (RLHF). Se utilizaron 2 billones de tokens de datos de fuentes de acceso público para pre-entrenar a Llama 2.
Si bien los modelos preentrenados pueden modificarse para una variedad de tareas de generación de lenguaje natural, los modelos personalizados están diseñados para una conversación similar a la de un asistente. Independientemente del modelo que elija un desarrollador, la guía de uso responsable de Meta AI puede ayudar a dirigir cualquier ajuste adicional que pueda ser necesario para adaptar y optimizar los modelos con las mitigaciones de seguridad adecuadas.
¿Cómo usar llama 2?
Hay excelentes noticias si quieres jugar Llama 2 de Meta AI por ti mismo. Huggingface tiene una versión de demostración fácilmente disponible. Solo sigue estos sencillos pasos:
- Visita esta página.
- Cuando llegue al sitio web, desplácese hacia abajo hasta que vea una sección marcada como “Demostración”.
- Hay un cuadro de chat allí. Introduzca un mensaje en él ahora mismo.
- Para enviar su mensaje, presione enter.
A través de SageMaker JumpStart en la interfaz de usuario de SageMaker Studio y SageMaker Python SDK, puede acceder a los modelos básicos. En esta sección, analizamos la búsqueda de modelos en SageMaker Studio.
Un entorno de desarrollo integrado (IDE) llamado SageMaker Studio ofrece una única interfaz visual basada en web a través de la cual puede acceder a herramientas creadas específicamente para llevar a cabo todas las tareas de desarrollo de ML, desde la recopilación de datos hasta la creación, prueba e implementación de sus modelos de ML. Consulte Amazon SageMaker Studio para obtener más información sobre cómo instalar y configurar SageMaker Studio.
Una vez en SageMaker Studio, haga clic en Soluciones preconstruidas y automatizadas para acceder a SageMaker JumpStart, que incluye modelos preentrenados, notebooks y soluciones prediseñadas.
Puede buscar soluciones, modelos, cuadernos y otros recursos desde la página de destino de SageMaker JumpStart. En el carrusel Foundation Models: Text Generation, hay dos modelos destacados de Llama 2 para elegir. Actualice su versión de SageMaker Studio deteniéndola y reanudándola si no puede ver los modelos de Llama 2. Consulte Apagar y actualizar las aplicaciones de Studio para obtener detalles adicionales sobre las actualizaciones de versiones.
Al seleccionar Explorar todos los modelos de generación de texto o escribir “llama” en el cuadro de búsqueda, también puede localizar las cuatro variaciones de modelo restantes.
Para leer información sobre el modelo, incluida su licencia, los datos de entrenamiento utilizados y las instrucciones de uso, elija la tarjeta del modelo. Implementar y Abrir Notebook son dos botones más que lo ayudan a usar el modelo.
Debe reconocer el acuerdo de licencia de usuario final y la política de uso aceptable en una ventana emergente cuando seleccione cualquiera de los botones.
Pasará a la siguiente fase para utilizar el modelo después de reconocerlo.
El siguiente ejemplo demuestra cómo emplear modelos Llama con aprendizaje en contexto de pocas tomas al darle al modelo acceso a datos de entrenamiento. Tenga en cuenta que solo sacamos conclusiones del modelo que se ha implementado y que los pesos del modelo permanecen constantes en todo momento.
Entrada: Traducir inglés a francés:
nutria marina => loutre de mer
menta => menthe poivrée
peluche jirafa => jirafa peluche
queso =>Producción:
fromage
chocolate => chocolate
coche => coche
hámster => hámster
cerveza => cerveza
bicicleta => bicicleta
plátano => plátano
fresa => fraise
pizza => pizza
hamburguesa con queso => hamburguesa con queso
piña => ananas
zanahoria => carotte
sandía => pastèque
ballena => ballena
berenjena => berenjena
gato => chatear
pingüino => manot
león => león
elefante => elefante
panda => panda
tigre => tigre
salmón => salteado
ardilla => écureuil
canguro => canguro
tortuga => tortuga
pulpo => pulpo
rana => grenouille
cerdo => cochon
pez dorado => poisson rouge
tiburon tigre => requin tigre
gorila => gorila
dol
Meta IA
Microsoft reveló la disponibilidad de Llama 2 en la biblioteca de modelos de Azure AI en su conferencia Microsoft Inspire. Ahora, los programadores pueden usarlo para crear. Además, está diseñado para operar localmente en Windows para simplificar los flujos de trabajo para los desarrolladores de IA. El centro Jumpstart de Amazon SageMaker de AWS también ofrece Llama 2, y seguirán otros proveedores.
También se reveló el lanzamiento de un ecosistema abierto entre Microsoft y Meta AI para marcos de trabajo de IA intercambiables. El estándar Open Neural Network Exchange (ONNX) para modelos de aprendizaje profundo fue anunciado por primera vez en 2017 por Meta AI (anteriormente Facebook), y fue entonces cuando comenzó el desarrollo.
Los dos se comprometieron a fomentar el desarrollo de la IA abierta, en particular otorgando a más empresas de todo el mundo acceso a la tecnología fundamental de la IA.
Según Meta AI, los modelos Llama 2 se sometieron a un proceso de trabajo en equipo rojo, en el que los empleados tenían la tarea de identificar las debilidades en la arquitectura de seguridad de los modelos y garantizar su seguridad. Además, se utilizaron fuentes externas para crear “indicaciones adversas” para ayudar en el ajuste fino del modelo.
El esquema de transparencia en el artículo de investigación que detalla Llama 2 describe los inconvenientes del modelo y cómo Meta planea lidiar con ellos en el futuro. Los usuarios de Llama 2 deben adherirse a una política de “uso aceptable”, que prohíbe usar el modelo para producir código dañino, permitir la transferencia no autorizada de información o materiales a menores, o producir contenido que promueva el terrorismo. Puede acceder a la lista completa aquí.
Para alentar a los programadores a adoptar el modelo de lenguaje “para resolver problemas difíciles”, Meta ha lanzado Llama Impact Challenge, con más información próximamente.
Antes de irse, lea nuestro artículo: 15 mejores ideas de IA de personajes para disfrutar mejor de sus conversaciones
Crédito de la imagen destacada: Unsplash.
Source: Meta AI: ¿Qué es llama 2 y cómo usarlo? • Resumen técnico