Mientras Meta presenta su creación más reciente, LLaMA 2 vs GPT-4 actualmente ocupa las mentes de numerosos entusiastas de la IA. Sin embargo, el sorprendente anuncio de Meta sobre el código abierto de este formidable modelo de lenguaje también fue noticia en un sorprendente giro de los acontecimientos.
Esta decisión catapultó instantáneamente a LLaMA 2 al reino de los titanes de la IA, preparando el escenario para un enfrentamiento épico con el renombrado GPT-4 de OpenAI, la potencia detrás de ChatGPT y Microsoft Bing.
LLaMA 2 vs GPT-4 en varias comparativas
LLaMA 2-Chat, una creación notable, debe su existencia al aprendizaje de ajuste y refuerzo con valiosos comentarios humanos. Este proceso involucró la recopilación de datos de preferencia y modelos de recompensa de entrenamiento, incorporando una técnica novedosa conocida como Atención de fantasmas (GAtt). Además, LLaMA 2-Chat se beneficia de haber sido capacitado en las salidas GPT-4, un factor esencial en su desarrollo.
LLaMA 2 vs GPT-4: Grados
Para evaluar la eficacia del modelo, Meta realizó un estudio en humanos utilizando 4.000 avisos, utilizando el “ratio de victorias” métrica, similar al punto de referencia de Vicuna, para compararlo con modelos de código abierto y de código cerrado como ChatGPT y PaLM, en el contexto de avisos de uno o varios turnos.
el impresionante 70B LLaMA 2 modelo funciona a la par con GPT-3.5-0301 y supera a otros modelos como Falcon, MPT y Vicuna. Los modelos LLaMA 2-Chat se destacan por su utilidad para las indicaciones de uno o varios turnos, superando las alternativas de código abierto. Con una tasa de ganancias del 36% y una tasa de empate del 31,5% en comparación con ChatGPT, LLaMA 2-Chat demuestra su valía.
Además, supera al modelo de chat MPT-7B en 60% de las indicaciones. La tasa de ganancias general del modelo LLaMA 2-Chat 34B de más de 75% contra los modelos Vicuna-33B y Falcon 40B de tamaño equivalente es una hazaña impresionante. Además, el modelo 70B eclipsa el modelo de chat PaLM-bison por un margen significativo.
LLaMA 2 vs GPT-4: Codificación
Sin embargo, cuando se trata de codificar entre LLaMA 2 y GPT-4, a pesar de sus numerosos logros, LLaMA-2 tiene una debilidad en lo que respecta a la codificación. No alcanza la destreza de codificación exhibida por GPT-3.5 (48.1) y GPT-4 (67). Mientras que el benchmark MMLU muestra las fortalezas de LLaMA-2, HumanEval revela que su capacidad de codificación es algo menor en comparación con los modelos diseñados explícitamente para la codificación, como StarCoder (33.6). No obstante, considerando los pesos abiertos de LLaMA-2, es muy probable que experimente mejoras significativas con el tiempo.
LLaMA 2 vs GPT-4: Escritura
Cuando se trata de escribir, LLaMA-2 y GPT-4 exhiben marcadas diferencias. Sus enfoques de escribiendo poesia, por ejemplo, no podría ser más distinto. ChatGPT emplea elecciones intencionales de palabras, centrado en fonética y a vocabulario más sofisticado, similar a un poeta hábil con una amplia gama de expresiones. En cambio, LLaMA-2 opta por una selección de palabras que riman más sencilla, similar a un poema de la escuela secundaria.
Le pedí a Llama-2 y GPT-4 que escribieran un poema sobre su competencia épica. Adivina cuál es cuál.
========= Poema 1 =========
En el gran tapiz del tejido de la tecnología,
Donde la información gira y las ideas se unen,
Dos figuras se paran, sus historias se entrelazan,
GPT y Llama-2,…—Jim Fan (@DrJimFan) 18 de julio de 2023
A pesar de haber sido entrenado a menor escala, LLaMA-2 ha cosechado resultados encomiables, según los comentarios de varios usuarios que han tenido acceso beta. El enfoque de Meta, inicialmente utilizando datos disponibles públicamente y luego aumentándolo con datos de alta calidad, tiene eficacia comprobada para lograr mejores resultados con menos ejemplos. Se ha observado que los resultados del modelo son comparables a las anotaciones humanas, un testimonio de la naturaleza meticulosa de su desarrollo.
LLaMA 2 vs GPT-4: Resultados con el mismo aviso
Es importante tener en cuenta que comparar estos dos modelos en su totalidad puede no ser del todo justo dado que solo tenemos acceso a la versión de demostración de Llama 2. Sin embargo, usar el mismo mensaje para GPT-4 y Llama 2 nos dará algunos ideas interesantes en sus respectivas capacidades y tendencias estilísticas.
El aviso: “Escríbame un pasaje de 100 palabras sobre la importancia de los chatbots.”
- GPT-4:
Parece que la respuesta de GPT-4, aunque más corta y sucinta en 93 palabras, proporciona con éxito información precisa.
- Demostración de Llama 2:
Por otro lado, Llama 2 se inclina por una respuesta más integral con 122 palabras. Aunque es un poco más detallado teniendo en cuenta el aviso dado, ofrece información loablemente detallada.
Antecedentes de LLaMA 2
El viaje de LLaMA comenzó en febrero, generando entusiasmo dentro de la comunidad de investigación de IA. Una filtración poco después del anuncio solo aumentó la intriga. Ahora, con el lanzamiento de LLaMA 2 como modelo de código abierto, su audiencia potencial ha se expandió exponencialmente. Con más de 100.000 solicitudes recibido para el modelo LLaMA inicial, el impacto de LLaMA 2 será aún más profundo.
Durante el evento Inspire de Microsoft, Meta no solo mostró su soporte inquebrantable para las plataformas Azure y Windows de Microsoft, sino que también lanzó una bomba. haciendo que LLaMA 2 sea de libre acceso tanto para fines comerciales como de investigación. Este movimiento marcó un hito significativo, ya que abrió una amplia gama de posibilidades para que las empresas, las nuevas empresas y los investigadores aprovecharan el potencial de este modelo de lenguaje innovador.
En comparación con su predecesor, LLaMA 2 experimentó mejoras sustanciales. entrenado en 40 por ciento más de datos, incluidas las fuentes en línea disponibles públicamente, LLaMA 2 mostró un rendimiento superior en áreas como el razonamiento, la codificación, la competencia y las pruebas de conocimiento, superando a otros grandes modelos de lenguaje como Falcon y MPT.
Priorizando la seguridad y la transparencia
Meta demostró su dedicación a la seguridad y la transparencia al someter a LLaMA 2 a rigurosos “equipo rojo” y sintonia FINA a través de indicaciones adversarias. Estos esfuerzos aseguraron que LLaMA 2 cumpla con los más altos estándares de seguridad y permita a los investigadores y desarrolladores obtener una comprensión clara de su desempeño a través de procesos de evaluación transparentes.
Accesibilidad entre plataformas
En línea con su compromiso con los principios de código abierto, Meta aseguró que LLaMA 2 sería accesible en múltiples plataformas. Inicialmente disponible a través de Azure de Microsoft, LLaMA 2 pronto llegará a otras plataformas como AWS, abrazando la cara, y otros. Este enfoque inclusivo fomenta la adopción generalizada y la colaboración entre desarrolladores e investigadores, lo que impulsa el avance de las aplicaciones de IA.
El poder de un enfoque abierto de la IA
La estrategia de código abierto de Meta se alinea con el panorama en rápida evolución de la tecnología de IA generativa. Al democratizar el acceso a modelos de vanguardia como LLaMA 2, Meta fomenta una comunidad colaborativa de desarrolladores e investigadores quienes pueden probar colectivamente el modelo, identificar problemas potenciales y acelerar las soluciones, lo que en última instancia impulsa la innovación de la IA.
LLaMA 2 frente a GPT-4 y PaLM 2
Si bien LLaMA 2 puede ser un poco menos poderoso que sus competidores, GPT-4 y PaLM 2, su naturaleza de código abierto y el énfasis de Meta en la seguridad y la transparencia son diferenciadores clave. LLaMA 2 fue entrenado en dos millones de fichas, menos que PaLM 2 3,6 millones de fichas, y es compatible con 20 idiomas, detrás Los 100 idiomas de PaLM 2 y los 26 de GPT-4. Sin embargo, el poder de la colaboración de código abierto y el desarrollo impulsado por la comunidad pueden compensar estas diferencias y conducir a avances rápidos.
Un momento crucial para el desarrollo de la IA
La decisión de Meta de abrir las marcas LLaMA 2 un punto de inflexión en el panorama de la IA. Al hacer que este poderoso modelo de lenguaje de libre acceso, Meta permite a los desarrolladores e investigadores ampliar los límites de la innovación de la IA al tiempo que garantiza que la seguridad y la transparencia permanezcan a la vanguardia. La colaboración con microsoft y Qualcomm consolida aún más el futuro brillante de las aplicaciones de IA, prometiendo una integración perfecta en diversas plataformas y dispositivos.
A medida que los desarrolladores e investigadores se embarcan en este viaje con LLaMA 2 y continúa la competencia entre LLaMA 2 y GPT-4, podemos esperar una ola de herramientas transformadoras impulsadas por IA para emerger, remodelar nuestras interacciones con la tecnología. El compromiso de Meta con la apertura sienta un precedente para el refinamiento colaborativo y el aprovechamiento de los modelos de IA, allanando el camino para una nueva generación de innovaciones de IA que darán forma al futuro de la inteligencia artificial.
Foto principal: Crédito
Source: LLaMA 2 vs GPT-4: ¿Qué tan competitivo es Meta en la carrera de IA? • Resumen técnico