La carrera por la supremacía de la inteligencia artificial (IA) se está intensificando entre Gemini y ChatGPT, y los gigantes tecnológicos compiten por desarrollar los modelos de IA más potentes y versátiles.
Tras la impresionante revelación del GPT-4o de OpenAI, Google ha entrado en la carrera de la IA con una cautivadora demostración de su propio prototipo para su inmensamente popular chatbot, Gemini.
un vídeo de La cuenta X de Google mostró un teléfono Pixel ejecutando Gemini analizando imágenes en vivo, presumiblemente filmadas durante los preparativos para la próxima conferencia de desarrolladores Google I/O.
La demostración revela la destreza conversacional de Gemini
En el vídeo mostrado, a través de indicaciones habladas, el usuario consulta a la IA sobre la actividad en la pantalla. La respuesta de Géminis, pronunciada con una voz que suena natural, demuestra una comprensión del contexto visual. Identifica correctamente la construcción del escenario como preparación para un gran evento. Cuando se le pregunta acerca de las letras que aparecen en una pantalla, Gemini las reconoce como señalización de Google I/O y ofrece una breve descripción del evento.
Al igual que la reciente demostración ChatGPT de OpenAI, el vídeo Gemini de Google destaca por el flujo natural de la conversación. La interacción del usuario se siente casi humana, y las respuestas de Gemini reflejan el ritmo de un diálogo amistoso.
Un día más hasta #GoogleIO! estamos sintiendo
. Nos vemos mañana para conocer las últimas noticias sobre IA, búsqueda y más. pic.twitter.com/QiS1G8GBf9
– Google Google) 13 de mayo de 2024
Este enfoque conversacional es una desviación significativa de las interacciones, a menudo forzadas, experimentadas con modelos de IA anteriores. La capacidad de participar en un intercambio de ida y vuelta, aclarando información y adaptando las respuestas en función de las consultas de los usuarios, allana el camino para una experiencia de IA más intuitiva y fácil de usar.
Y parece que una vez más la innovación nacerá de la competencia: Gemini vs ChatGPT.
La conciencia del contexto es la mina de oro aquí
Si bien la demostración se centró en un escenario alegre, las aplicaciones potenciales de Gemini se extienden mucho más allá de los fines de entretenimiento. La capacidad de analizar información visual en tiempo real podría cambiar las reglas del juego en varios campos.
Imagine a un médico que utiliza Gemini durante la consulta de un paciente, donde la IA puede analizar instantáneamente imágenes médicas y proporcionar información o diagnósticos potenciales. En el ámbito educativo, los estudiantes podrían utilizar Gemini para mejorar su experiencia de aprendizaje haciendo que la IA analice objetos, experimentos o artefactos históricos en tiempo real, fomentando una comprensión más profunda del tema.
El prototipo aún está en construcción y aún no se han revelado todas sus capacidades. Sin embargo, la demostración ofrece una visión prometedora del futuro de la interacción con la IA. Al combinar el procesamiento del lenguaje natural con el análisis de video en tiempo real, Gemini tiene el potencial de cambiar y mejorar la forma en que interactuamos con la información y el mundo que nos rodea, al igual que el GPT-4o de OpenAI.
Entonces, ¿cuándo tendremos más detalles? El evento Google I/O comenzará esta tarde a las 10 a.m. PT / 1 p.m. ET así que mantente atento y sigue leyéndonos para ser testigo del futuro de la tecnología.
Crédito de imagen destacada: Solen Feyissa/Unsplash
Source: Google Gemini se está preparando para competir con GPT-4o

. Nos vemos mañana para conocer las últimas noticias sobre IA, búsqueda y más.