ChatGPT es un poderoso modelo de lenguaje, capaz de generar texto notablemente parecido al humano.
Sin embargo, cuando esas respuestas se leen en voz alta mediante texto a voz (TTS), a veces pueden tener una calidad artificial o robótica.
Si buscas una salida hablada sorprendentemente natural, ¡es hora de agregar un poco de sabor a la mezcla! Veamos técnicas para conseguir esa sensación de habla auténtica.
Cómo mejorar tu salida de ChatGPT
En las conversaciones cotidianas, las personas rara vez hablan con oraciones perfectamente formadas y gramaticalmente correctas. Usamos palabras de relleno como “um”, “uh”, “me gusta” y “ya sabes”. Estos pueden parecer un desorden verbal, pero en realidad cumplen una función importante en el habla natural.
Puede indicarle a la función de voz de ChatGPT que incluya estratégicamente estos rellenos en sus respuestas. Esto ayudará a que suene más conversacional.
He aquí un ejemplo:
- Inmediato: Explique la diferencia entre tiempo y clima.
- Mensaje modificado: ¿Podrías explicar, um, la diferencia entre tiempo y clima? Tal vez utilice algunos “me gusta” y “ya sabes” también.
Los sistemas TTS convertirán esas palabras de relleno en pausas y vacilaciones, haciendo que el resultado parezca más orgánico. ¡Experimenta para encontrar el nivel adecuado para el estilo que deseas!
Aquí está la respuesta original:

Y aquí está la respuesta con nuestro mensaje modificado:

Además de eso, la gente utiliza naturalmente contracciones en el habla cotidiana. “No puedo” se convierte en “no puedo”, “es” se convierte en “es”, y así sucesivamente. Estos hacen que el habla fluya con mayor fluidez y parezca conversacional. Puede alentar a ChatGPT a utilizar contracciones para aumentar su patrón de habla “humano”.
El habla humana real tiene variación de tono. Usamos cambios de tono, volumen y velocidad para enfatizar las palabras o agregar emoción. Aquí es donde una puntuación específica puede guiar su TTS:
- Agregar comas para pausas: “El clima hoy es soleado, cálido y perfecto para una caminata”.
- Signos de exclamación por emoción.: “¡Esa película fue increíble! Me encantó el final”.
- Los signos de interrogación transmiten curiosidad.: “Siempre me he preguntado, ¿cómo aprenden los pájaros a volar?”
La práctica hace progresar
Como cualquier habilidad, hacer que la salida hablada de ChatGPT suene más natural requiere práctica. Pruebe diferentes combinaciones de técnicas. Preste atención a sus podcasts o audiolibros favoritos para ver cómo los oradores profesionales utilizan las inflexiones vocales y las palabras de relleno con gran efecto.
Recuerde, ¡no existe una única forma “correcta” de hacer esto!
Una nota sobre los sistemas de texto a voz
La calidad de su sistema TTS también juega un papel importante. Algunos son mejores que otros para interpretar la puntuación para una pronunciación realista.
Las opciones populares incluyen:
- polly amazona
- Texto a voz de Google
- Texto a voz de Microsoft Azure
¿Cuándo podría menos ser más?
Si bien la salida ChatGPT que suena natural es excelente en muchos casos, hay ocasiones en las que una entrega más formal o “robótica” es apropiada. Piensa en estos escenarios:
- Entregar noticias o información factual.: La concisión y la claridad son importantes aquí.
- Accesibilidad: Algunos usuarios pueden encontrar confusos demasiados rellenos o cambios tonales.
¡Se trata de encontrar la mejor opción para el resultado deseado!
Crédito de imagen destacada: Jason Leung/Unsplash





