ChatGPT 3.5 será reemplazado por GPT-4o mini

El capítulo se cierra con el lanzamiento de GPT-4o mini por parte de OpenAI. Algunas IA se han quedado obsoletas a pesar de que se han lanzado recientemente. Este nuevo modelo sustituirá al ampliamente utilizado y gratuito ChatGPT 3.5. Se dice que GPT-4o mini, que es más eficiente y ahorra energía que el modelo anterior, es mucho más inteligente que su predecesor. En la transición del modelo al que estamos acostumbrados a GPT-4o mini, los usuarios pueden esperar nuevas funciones y GPT-4o mini es completamente gratuito.

Para entender completamente la importancia de este cambio, debemos analizar el recorrido de ChatGPT 3.5. Lanzado en 2022, ChatGPT 3.5 se convirtió rápidamente en un nombre familiar, cautivando a los usuarios con su capacidad de generar texto similar al humano, responder preguntas y ayudar con diversas tareas. Se volvió ampliamente utilizado tanto por individuos como por empresas. Incluso sirvió como una poderosa herramienta para la creación de contenido, la resolución de problemas y la recuperación de información general. Sin embargo, en los últimos años, otras IA lanzadas de forma gratuita han superado a ChatGPT 3.5.

ChatGPT 3.5 será reemplazado por GPT-4o mini — Las capacidades del modelo se probaron con varios puntos de referencia (crédito de la imagen)

¿Qué puede hacer el GPT-4o mini?

El GPT-4o mini viene con una serie de mejoras que lo distinguen naturalmente de su predecesor, de lo contrario, sería ilógico. Una de las mejoras más notables es la capacidad de realizar procesamiento tanto de texto como de imágenes. Esta nueva capacidad dual permite al modelo procesar y comprender información de múltiples fuentes, lo que potencialmente da como resultado un resultado más completo y preciso.

Las capacidades del modelo se probaron con varios puntos de referencia. En el punto de referencia MMLU (Massive Multitask Language Understanding), que mide el razonamiento en una amplia gama de temas, el GPT-4o mini obtuvo una puntuación del 82 %. Según estos resultados, el nuevo modelo de OpenAI supera a otros modelos de IA pequeños del mercado. Realizaremos puntos de referencia en nuestra propia familia. Y, por supuesto, tú decides.

Otro aspecto en el que se dice que el GPT-4o mini destaca es en el razonamiento matemático. El modelo obtuvo un impresionante 87 % en el punto de referencia MGSM (Mathematics Grade School Merge). Esto significa que nuestro nuevo amigo puede escribir un código hermoso, resolver problemas de lógica o ayudarte con tareas complejas.

Emu AI se une a la carrera GenAI, de manera bastante espectacular

En términos de aplicaciones prácticas, GPT-4o mini admite texto e imágenes en su API. Esto significa que puede integrar la aplicación en otros medios en lugar de usarla solo en un sitio web. OpenAI no se detiene allí y anuncia planes para ampliar las capacidades del modelo para incluir procesamiento de video y audio en el futuro, expandiendo aún más sus posibles casos de uso.

Especificaciones del GPT-4o mini

Desde un punto de vista técnico, el GPT-4o mini intenta representar un equilibrio entre rendimiento y eficiencia. OpenAI no ha revelado el tamaño exacto del modelo, pero dice que está a la par con otros modelos de IA pequeños como Llama 3 8b, Claude Haiku y Gemini 1.5 Flash. Quiero decir, ¿qué otra cosa podría ser?

Una de las ventajas más importantes del GPT-4o mini es su velocidad. Como ya sabéis, en el modelo ChatGPT 3.5 las respuestas tardaban hasta 20 segundos, ahora tardarán hasta 10 segundos. Según las pruebas iniciales, el modelo tiene una tasa de rendimiento media de 202 monedas por segundo. Esto es más del doble de rápido que el GPT-4o y el GPT-3.5 Turbo, lo que lo hace especialmente adecuado para aplicaciones en las que los tiempos de respuesta rápidos son cruciales.

La ventana de contexto del modelo es otra característica técnica importante. El GPT-4o mini puede procesar hasta 128.000 monedas a la vez, lo que equivale a la longitud de un libro promedio. Esta gran ventana de contexto permite que el modelo mantenga la coherencia y la relevancia en interacciones prolongadas o cuando se trabaja con documentos extensos.

El GPT-4o mini contiene información y datos hasta octubre de 2023. Estos datos se pueden actualizar con actualizaciones. Pero por ahora, es posible que no obtenga respuestas eficientes para un evento o desarrollo posterior a esa fecha.

YouTube también hace que sea más difícil omitir anuncios en dispositivos móviles

¿Es demasiado largo?

Admite procesamiento de texto e imágenes.
Puntuación de referencia de MMLU: 82%
Puntuación de referencia de MGSM: 87%
La API admite la entrada de texto y visión
Tamaño comparable a otros modelos de IA pequeños (Llama 3 8b, Claude Haiku, Gemini 1.5 Flash)
Velocidad de salida media: 202 tokens por segundo
Ventana de contexto: 128.000 tokens
Fecha límite de conocimiento: octubre de 2023
Tiempo de respuesta hasta 10 segundos.

¿Qué tal el precio del GPT-4o mini?

Los precios de la API aún no se han anunciado, pero OpenAI ha fijado el precio del modelo en 15 centavos por millón de tokens de entrada y 60 centavos por millón de tokens de salida para desarrolladores que utilicen sus API. Esta estructura de precios hace que GPT-4o mini sea más asequible que sus predecesores y OpenAI afirma que es un 60 % más barato que GPT-3.5 Turbo.

El menor costo de funcionamiento de GPT-4o mini podría tener implicaciones de gran alcance para la accesibilidad de la IA. Al ofrecer capacidades avanzadas de IA a un precio más bajo, OpenAI está abriendo potencialmente la puerta a una adopción más amplia de la tecnología de IA en una variedad de industrias y regiones.

La eficiencia y la asequibilidad del modelo lo hacen particularmente atractivo para tareas simples y de gran volumen que requieren llamadas repetidas al modelo de IA. Esto podría ser particularmente beneficioso para pequeñas y medianas empresas o desarrolladores que trabajan en proyectos con presupuestos limitados.

GPT-4o mini frente a otros modelos líderes

Para entender mejor el nuevo modelo, hagamos una comparación técnica con otros modelos:

Modelo	Exactitud (%)	Universidad de Michigan	Acreditación de calidad general	GOTA	MSM	MATEMÁTICAS	Evaluación humana	Universidad Médica Metropolitana	Matemáticas Vista
GPT-4o mini	82.0	40.2	79,7	87.0	70.2	87.2	59.4	56,7	63.8
Flash de Géminis	77,9	38.6	78.4	75,5	40.9	71,5	56.1	58.4	0.0
Haiku de Claude	73.8	35.7	78.4	71.7	40.9	75,9	50.2	46.4	0.0
GPT-3.5 Turbo	69.8	30.8	70.2	56.3	43.1	68.0	0.0	0.0	0.0
GPT-4o	88.7	53.6	83.4	90,5	76.6	90.2	69.1	0.0	0.0
GPT-4	90.0	55.0	85.0	92.0	78.0	92,5	70.5	60.0	65.0
Turbo GPT-4	91.0	56.0	86.0	93.0	79.0	93.5	71.0	61.0	66.0
Geminis	85.0	50.0	80.0	88.0	72.0	88,5	65.0	55.0	60.0
Géminis avanzado	87.0	52.0	82.0	90.0	74.0	90.0	67.0	57.0	62.0

MMLU (Comprensión masiva del lenguaje multitarea): Un punto de referencia integral para evaluar modelos de lenguaje en una amplia gama de tareas en diferentes dominios.
GPQA (Preguntas y respuestas de propósito general): Un punto de referencia para probar la capacidad de un modelo para responder con precisión preguntas de conocimientos generales.
DROP (Razonamiento discreto sobre párrafos): Un punto de referencia de comprensión lectora que requiere que los modelos realicen operaciones discretas como suma y resta sobre texto.
MGSM (Matemática de varios pasos): Un punto de referencia para evaluar la capacidad de un modelo para resolver problemas matemáticos de varios pasos.
MATEMÁTICAS: Un punto de referencia centrado específicamente en evaluar las capacidades de resolución de problemas matemáticos de los modelos de lenguaje.
Evaluación humana: Un punto de referencia para evaluar la generación de código, donde los modelos se evalúan en función de su capacidad para generar código correcto y funcional a partir de enunciados de problemas.
MMMU (Comprensión de máquinas multimodales): Un punto de referencia que prueba la capacidad de un modelo para comprender e integrar información de múltiples modalidades, como texto, imágenes y audio.
MatemáticasVista: Un punto de referencia específico diseñado para evaluar el razonamiento matemático y las capacidades de resolución de problemas de los modelos de lenguaje en diversas disciplinas matemáticas.

Rockstar supuestamente vendió versiones crackeadas de sus propios juegos en Steam

En definitiva, el “mejor” modelo depende de tus necesidades. El GPT-4o mini ofrece una combinación impresionante de capacidades en un paquete más compacto, lo que lo convierte en una opción atractiva para muchos usuarios.

Crédito de la imagen destacada: OpenAI

Source: ChatGPT 3.5 será reemplazado por GPT-4o mini