Google lanzó Gemini 3.1 Flash-Lite, su modelo Gemini 3 más rápido y asequible hasta el momento, con un precio de 0,25 dólares por millón de tokens de entrada y 1,50 dólares por millón de tokens de salida.
El modelo apunta a cargas de trabajo de desarrolladores de gran volumen, procesamiento de datos y tareas de traducción. Está disponible en versión preliminar a través de la API de Gemini en Google AI Studio y Vertex AI, pero no está incluido en la aplicación para consumidores de Gemini.
En comparación con Gemini 2.5 Flash-Lite, la nueva versión es más cara pero significativamente más capaz. Generalmente supera al Gemini 2.5 Flash a un precio más bajo.
El modelo supera a competidores como GPT-5 mini y Claude 4.5 Haiku. Grok 4.1 Fast es más asequible, pero Gemini 3.1 Flash-Lite es más rápido y promete hasta 363 tokens por segundo.
En los puntos de referencia multimodales, el modelo obtuvo 1432 puntos Elo en la tabla de clasificación de Arena.ai. Esto lo sitúa entre los modelos de peso abierto y las ofertas comerciales de última generación.
Google no publicó pruebas comparativas de agentes para el lanzamiento. La compañía afirmó que el modelo está destinado a tareas y procesamiento de datos de gran volumen, no a la gestión de flotas de agentes.
Los desarrolladores pueden utilizar la API para ajustar el tiempo de razonamiento del modelo para controlar los costos. Las configuraciones de razonamiento más bajas producen menos tokens, lo cual es relevante para cargas de trabajo de gran volumen.
Esta es la primera versión Flash-Lite para Gemini 3.1. Google tradicionalmente lanza primero versiones Flash más potentes o se salta Flash-Lite por completo, como lo hizo con Gemini 3.
Google lanzó Gemini 3.1 Pro dos semanas antes. La compañía describe Flash-Lite como diseñado para cargas de trabajo de desarrolladores de gran volumen a escala.







