Alibaba AI ha presentado una tecnología innovadora llamada EMO (abreviatura de “Emote Portrait Alive”) que tiene el poder de transformar retratos estáticos en videos animados realistas.
¡Prepárate, porque la IA está cambiando la forma en que pensamos sobre el vídeo! Empresas como OpenAI y Alibaba nos están volviendo locos con nuevas herramientas. ¿Recuerdas a Sora de OpenAI? Podría crear personajes de video de cuerpo completo solo a partir de texto. Ahora, Alibaba tiene algo llamado EMO (“Emote Portrait Alive”) que puede tomar cualquier retrato antiguo y darle vida.
Es una gran oferta, especialmente si te encanta hacer videos o te fascina la IA. Profundicemos en cómo funciona EMO y qué locuras puedes hacer con él.
¿Qué es Alibaba AI EMO (Emote Portrait Alive)?
EMO es un sistema avanzado de inteligencia artificial desarrollado por Alibaba que puede generar videos realistas de conversaciones y cantos a partir de una única imagen fija. Utiliza generación de vídeo de cabezas parlantes impulsadas por audio para crear animaciones increíblemente realistas.
Analicemos cómo funciona EMO:
- Entrada de imagen única: La magia de EMO comienza con un único retrato. Puede ser un personaje histórico, un personaje ficticio o incluso tu propia imagen.
- Entrada de audio: Para animar el retrato, EMO requiere una entrada de audio, ya sea hablada o cantada.
- Magia de IA: Los sofisticados algoritmos de inteligencia artificial de EMO analizan tanto la imagen como el audio, generando expresiones faciales, formas de boca y movimientos de cabeza precisos que se sincronizan perfectamente con el audio proporcionado.
Alibaba AI EMO se distingue por su capacidad de producir animaciones increíblemente realistas. Los vídeos que genera a menudo son indistinguibles de las imágenes reales, lo que desdibuja la línea entre el contenido impulsado por IA y la realidad. Este nivel de realismo es un gran paso adelante en la tecnología de animación impulsada por IA.
Más allá de los movimientos realistas, EMO maneja tanto el canto como el audio hablado con facilidad. Ya sea que proporciones una grabación de voz o una canción, EMO animará el retrato con expresiones apropiadas que coincidan con el audio. Esta versatilidad la convierte en una herramienta poderosa para una variedad de aplicaciones.
EMO también ofrece flexibilidad al permitir que la duración del vídeo animado sea determinada por la duración de la entrada de audio. Esto significa que puedes crear clips cortos o animaciones más largas y profundas según sea necesario.
Espera, ¿Alibaba tiene un equipo de proyecto de investigación de IA?
Alibaba tiene en marcha un importante proyecto de investigación de IA.
En 2017, establecieron la Academia DAMO (Discovery, Adventure, Momentum, Outlook), una iniciativa de investigación global dedicada a explorar tecnologías de vanguardia como la inteligencia artificial, el aprendizaje automático y la inteligencia de datos. Alibaba aplica activamente la IA en su amplia plataforma de comercio electrónico y en varias otras áreas.
Por ejemplo, la IA desempeña un papel en la optimización de las rutas de entrega y la gestión de almacenes dentro de sus sistemas logísticos inteligentes. También impulsa los chatbots y el servicio al cliente a través del procesamiento del lenguaje natural y crea recomendaciones de productos personalizadas para los clientes. Alibaba demuestra su compromiso con la investigación de la IA al invertir miles de millones de dólares en estos esfuerzos.
La plaga de los deepfake
La EMO de Alibaba AI plantea un grave riesgo para el ya preocupante mundo de los deepfakes. Tiene el potencial de facilitar mucho la creación de contenido engañoso. Con EMO, alguien sin amplios conocimientos técnicos podría generar vídeos de aspecto realista de personas diciendo cosas que nunca hicieron. La avanzada tecnología de animación de EMO amenaza con hacer que estos deepfakes sean aún más convincentes, borrando la línea entre lo real y lo fabricado. Esta capacidad de manipular la imagen de una persona con sólo una entrada de audio abre la puerta a tergiversaciones potencialmente devastadoras.
EMO subraya las alarmantes capacidades de la manipulación impulsada por la IA. Este tipo de tecnología puede ser peligrosa en las manos equivocadas y pone de relieve la necesidad urgente de regulaciones y salvaguardias más estrictas. El daño potencial varía desde una simple difamación hasta campañas de desinformación a gran escala que podrían desestabilizar por completo la confianza en los medios. Es fundamental abordar la EMO y tecnologías similares con extrema precaución para intentar prevenir estas consecuencias negativas.
Vea el trabajo de investigación completo aquí.
Crédito de imagen destacada: Mark Daynes/Unsplash.