De acuerdo a Autoridad de AndroidLa última versión beta de la aplicación Gemini Android, específicamente la versión 16.30.59.SA.Arm64 de la aplicación beta de Google App, indica el próximo soporte para archivos adjuntos de archivos de audio en los chats. Los usuarios ahora pueden observar una opción para adjuntar archivos de audio, como MP3, a sus conversaciones dentro de la aplicación.
Al adjuntar un archivo de audio, aparece un nuevo aviso, “Hablar en vivo de esto”. Sin embargo, a pesar de esta sugerencia prometedora, la funcionalidad de procesamiento de audio aún no está completamente operativa. Cuando se carga un archivo de audio, Gemini actualmente lucha por comprender o responder al contenido de manera significativa. En algunos casos, la aplicación ignora por completo el archivo de audio adjunto, mientras que en otros, puede proporcionar información segura pero fabricada, un fenómeno conocido como alucinación de chatbot, que no es exclusivo de los archivos de audio o Gemini.
A pesar de las limitaciones actuales, la integración del soporte de archivos de audio se alinea con las capacidades existentes de Gemini en el lado del desarrollador. La API de Gemini ya admite la entrada de audio, lo que permite a los desarrolladores alimentar el audio y solicitar descripciones, resúmenes o transcripciones del contenido. La API también puede manejar solicitudes específicas de la marca de tiempo, como “de 2:30 a 3:29”, y es compatible con varios formatos de audio, incluidos MP3, WAV y FLAC.
Esto sugiere que Google probablemente esté desarrollando una función de procesamiento de audio robusta similar para la aplicación Android. Si bien la implementación actual parece ser un marcador de posición en lugar de un producto terminado, el movimiento hacia el soporte de audio se considera una progresión lógica, especialmente dado que las cargas de imágenes ya están ampliamente disponibles dentro de la aplicación Gemini. No hay una línea de tiempo oficial para el lanzamiento completo de esta función.
Source: Gemini Android ahora permite a los usuarios subir archivos de audio





