Hoy se marca un hito importante en el desarrollo de la IA con el lanzamiento del modo de voz avanzado de ChatGPT, que comienza su fase alfa.
Una filtración reciente en X.com revela que un grupo selecto de usuarios de ChatGPT Plus obtendrá acceso anticipado a esta función tan esperada, lo que les permitirá participar en conversaciones similares a las humanas con su asistente de inteligencia artificial favorito.
Pero si bien la IA conversacional está avanzando rápidamente, ya hay mucho ruido, y no solo sobre las nuevas funciones.
¿Cuándo se lanzará el modo de voz avanzado de ChatGPT?
Si bien el lanzamiento del Modo de voz avanzado de ChatGPT de hoy marca la primera oportunidad para que un grupo selecto de usuarios de ChatGPT Plus prueben esta función, no todos tendrán acceso inmediato.
Según la filtración, la participación en esta fase alfa dependerá de una variedad de factores; esencialmente, no todos los suscriptores de Plus pueden esperar experimentar esta característica innovadora todavía.
Un correo electrónico del equipo de ChatGPT confirma que el modo avanzado es parte de una implementación alfa limitada que comienza hoy, martes. 24 de septiembre de 2024Si bien OpenAI ha prometido que “todos los usuarios de Plus tendrán acceso a fines del otoño”, esta prueba alfa es el primer paso tangible hacia ese objetivo.
¡Parece que se ha confirmado que el modo Voz Avanzada se lanzará para un número selecto de usuarios este martes 24 de septiembre de 2024! foto.twitter.com/XJa2o4HIaJ
—“Brian” (@Arktophylaxxx) 23 de septiembre de 2024
A pesar de la naturaleza limitada del lanzamiento, hay entusiasmo en la comunidad. Muchos lo ven como una señal de que OpenAI está comprometida a cumplir su promesa de llevar este nuevo modo conversacional a los usuarios antes de que termine el año. Y para aquellos que no obtienen acceso de inmediato, es un indicador seguro de que un lanzamiento público completo está cerca.
¿Qué es el modo de voz avanzado de ChatGPT?
OpenAI demostró por primera vez el modo de voz avanzado en mayo de 2024, mostrando el siguiente paso en cómo interactuamos con la IA.
A diferencia de las versiones anteriores, este nuevo modo permite interacciones dinámicas, en tiempo real y similares a las humanas con ChatGPT, incluida la capacidad de interrumpir o redirigir la conversación a mitad de una oración si se desvía del tema o se vuelve demasiado detallada.
Esto es especialmente interesante para los usuarios que desean conversaciones más naturales y fluidas sin tener que esperar una respuesta de texto o tener que lidiar con respuestas largas y enrevesadas. ¡Ahora puede hacer preguntas complejas y esperar respuestas sofisticadas y detalladas del chatbot en tiempo real!
Una nueva era de IA conversacional
Este lanzamiento acerca a ChatGPT a un futuro en el que interactuar con la IA se siente tan natural como hablar con otra persona. Si bien OpenAI alguna vez estuvo por delante de la competencia (habiendo sido el primero en probar el modo de voz avanzado), la compañía ha comenzado a sentir la presión de sus rivales. Google ya lanzó Gemini Live, una IA de alcance similar, mientras que el rumoreado Siri 2.0 de Apple está generando revuelo con sus capacidades de IA mejoradas.

El panorama competitivo de la IA conversacional se está calentando, pero esta prueba alfa podría ser el empujón que OpenAI necesita para volver a la vanguardia de la carrera. Se espera que la capacidad mejorada del modo de voz haga que ChatGPT sea más fácil de usar y accesible, especialmente para quienes están en movimiento, donde escribir consultas largas no siempre es posible.
Esperemos que el viaje sea más tranquilo.
Sin embargo, no todo es fácil para OpenAI a medida que se acerca la fecha de lanzamiento del modo de voz avanzado de ChatGPT.
En mayo, OpenAI se vio envuelta en un escándalo que involucró a la actriz Scarlett Johansson, cuya voz se utilizó para hacer una demostración de la función. Johansson, conocida por su icónica voz, se opuso a que su voz se utilizara sin su consentimiento explícito, lo que desató un debate sobre la inteligencia artificial ética y el uso de imágenes de celebridades en contenido generado por inteligencia artificial. Si bien OpenAI afirmó que se trataba de una voz genérica que, casualmente, sonaba similar, la reacción puso de relieve las complejidades de la tecnología de voz, especialmente cuando se trata de propiedad intelectual y derechos personales.
La controversia en torno a la voz de Johansson ha puesto de relieve importantes debates sobre dónde se debe trazar el límite en el contenido generado por IA, en particular cuando involucra a personas reales. A medida que OpenAI continúa desarrollando e implementando el Modo de voz avanzado, deberá navegar con cuidado por estas aguas legales y éticas para evitar más contratiempos.
El lanzamiento del modo de voz avanzado de ChatGPT marca un momento crucial en la evolución de la IA conversacional. Al permitir interacciones más naturales y fluidas, esta función amplía los límites de lo que la IA puede hacer. Con OpenAI compitiendo contra gigantes tecnológicos como Google y Apple, la presión es grande para ofrecer un producto refinado, ético y revolucionario. Pero el futuro parece prometedor para quienes esperan la oportunidad de hablar con ChatGPT, y como esta función entra en su fase alfa, el lanzamiento completo podría estar a la vuelta de la esquina.
Crédito de la imagen destacada:Emre Çıtak/Ideograma AI
Source: ¡El lanzamiento del modo de voz avanzado de ChatGPT está en camino!





