Microsoft ha lanzado “MAI-Transcribe-1”, un modelo de transcripción de inteligencia artificial que logra precisión de voz a texto en 25 idiomas ampliamente hablados. El modelo tiene como objetivo servir aplicaciones como reuniones, subtítulos y dictados.

MAI-Transcribe-1 estará disponible en Microsoft Foundry junto con otros modelos, MAI-Voice-1 y MAI-Image-2. Microsoft afirmó que este lanzamiento permite que “los modelos MAI estén ampliamente disponibles para uso comercial por primera vez”, lo que permite a los clientes evaluar y crear aplicaciones que aprovechan la inteligencia artificial en la transcripción, la voz y la generación de imágenes.

MAI-Voice-1 presenta una generación de voz hiperrealista que mantiene la identidad del hablante y los matices emocionales en todo el contenido extendido. Incluye una función de indicaciones de voz que puede desarrollar voces de marca personalizadas a partir de solo un minuto de audio grabado.

Mientras tanto, MAI-Image-2 es un nuevo modelo de generación de texto a imagen que destaca por representar iluminación natural, tonos de piel precisos y texto claro dentro de las imágenes. Este modelo se encuentra entre los tres primeros en la clasificación de conversión de texto a imagen de Arena.ai.

  Google Gemini ahora admite la carga de archivos de audio

Microsoft continúa reduciendo su dependencia de la tecnología OpenAI. La empresa ha criticado al GPT-4 por sus elevados costes y sus lentos tiempos de respuesta. Como tal, Microsoft ha iniciado el desarrollo de sus propios modelos de IA internos y está evaluando modelos de terceros para su función Copilot.

Mustafa Suleyman, director ejecutivo de IA de Microsoft, confirmó el enfoque en el desarrollo de modelos de IA “fuera de fronteras”, señalando que no alcanzarán la sofisticación de las ofertas de OpenAI. La reciente reestructuración del liderazgo de Copilot de Microsoft resultó en la formación de cuatro divisiones: experiencia Copilot, plataforma Copilot, aplicaciones Microsoft 365 y modelos de IA. Jacob Andreou, ex ejecutivo de Snap, dirigirá la división de experiencias de Copilot y reportará al director ejecutivo de Microsoft, Satya Nadella.

Marc Benioff, director ejecutivo de Salesforce, declaró anteriormente que Microsoft probablemente dejaría de usar la tecnología OpenAI, señalando los desafíos que enfrenta OpenAI, incluido el abandono de su proyecto Stargate de 500 mil millones de dólares destinado a construir centros de datos en todo Estados Unidos.

  YouTube presenta herramientas de búsqueda y vídeo impulsadas por IA en Google I/O 2026

Crédito de imagen destacada