UW

Investigadores de la Universidad de Washington (UW) desarrollaron un sistema de algoritmos capaces de convertir clips de audio en visuales realistas de las personas que pronunciaron tales palabras.

Así lo demostraron en un video publicado este 11 de julio en el sitio web de la institución, el cual muestra al expresidente estadounidense Barack Obama hablando sobre el terrorismo, la paternidad y la creación de empleo, entre otros temas.  

De acuerdo con el texto que acompaña este clip, el ‘lip-sync’ de Obama se realizó con base en distintos audios obtenidos de diferentes conferencias del personaje.

Tras pasar por esta nueva herramienta se obtuvieron resultados “nunca antes vistos”, afirmó Ira Kemelmacher-Shlizerman, profesora en la Escuela Paul W. Allen de Computación e Ingeniería de la UW. Pero, ¿para qué sirve este sistema?

“La conversión realista de audio a video tiene varias aplicaciones prácticas que van desde mejorar la calidad de una videoconferencia hasta la posibilidad de mantener una conversación con una figura histórica”, explicó la experta.

¿Cómo funciona?

El sistema desarrollado en la Universidad de Washington utiliza inteligencia artificial para reconocer movimientos de la boca y vincularlos a sonidos. Esto le permite, posteriormente, invertir el proceso.

Inteligencia artificial hace ‘lip-sync’ de Barack Obama
UW

Es por ello que el equipo decidió poner a prueba su herramienta con Barack Obama, ya que necesitaban ‘alimentarla’ con horas y horas de video sobre un mismo personaje para alcanzar los mejores resultados.

Este trabajo contó con el apoyo de grandes firmas tecnológicas como Samsung, Google, Facebook e Intel, así como de los Laboratorios de Investigación de Animación de la UW. Si quieres más información da click aquí.

Puede interesarte: Ya puedes aprender sobre inteligencia artificial en línea

DEJA UNA RESPUESTA

Please enter your comment!
Ingrese su nombre