M谩s

    Ha llegado la sincronizaci贸n de labios con m煤ltiples altavoces mediante IA

    - Advertisement -

    Rask IA, una herramienta de localizaci贸n de audio y video basada en inteligencia artificial, ha anunciado el lanzamiento de su nueva funci贸n Multi-Speaker Lip-Sync. Con sincronizaci贸n de labios impulsada por IA, 750.000 usuarios pueden traducir su contenido a m谩s de 130 idiomas para sonar tan fluido como un hablante nativo.

    Durante mucho tiempo ha habido una falta de sincronizaci贸n entre los movimientos de los labios y las voces en el contenido doblado. Los expertos creen que esta es una de las razones por las que el doblaje es relativamente impopular en los pa铆ses de habla inglesa. De hecho, los movimientos de los labios hacen que el contenido localizado sea m谩s realista y, por tanto, m谩s atractivo para el p煤blico.

    Hay un estudiar de Yukari Hirata, profesora conocida por su trabajo en ling眉铆stica, que dice que observar los movimientos de los labios (en lugar de los gestos) ayuda a percibir contrastes fon茅micos dif铆ciles en la segunda lengua. La lectura de labios es tambi茅n una de las formas en que aprendemos a hablar en general.

    鉂 Tambi茅n te interesa:El MIT publica libros blancos para guiar la gobernanza de la IAEl MIT publica libros blancos para guiar la gobernanza de la IA

    Hoy, con la nueva funci贸n de Rask, es posible llevar el contenido localizado a un nuevo nivel, haciendo que los videos doblados sean m谩s naturales.

    La IA reestructura autom谩ticamente la cara inferior bas谩ndose en referencias. Tiene en cuenta la apariencia del orador y lo que dice para que el resultado final sea m谩s realista.

    C贸mo funciona:

  • Sube un v铆deo con una o m谩s personas en el cuadro.
  • Traduce el v铆deo a otro idioma.
  • Presione el bot贸n ‘Verificaci贸n de sincronizaci贸n de labios’ y el algoritmo evaluar谩 la compatibilidad del video con sincronizaci贸n de labios.
  • Si el video pasa la verificaci贸n, presione ‘Lip Sync’ y espere el resultado.
  • Descarga el v铆deo.
  • Seg煤n Maria Chmir, fundadora y directora ejecutiva de Rask AI, la nueva funci贸n ayudar谩 a los creadores de contenido a ampliar su audiencia. La IA ajusta visualmente los movimientos de los labios para que parezca que un personaje habla el idioma con tanta fluidez como un hablante nativo.

    鉂 Tambi茅n te interesa:Las organizaciones adoptan la IA, pero enfrentan desaf铆osLas organizaciones adoptan la IA, pero enfrentan desaf铆os

    La tecnolog铆a se basa en el aprendizaje de la red generativa adversarial (GAN), que consta de un generador y un discriminador. Tanto el generador como el discriminador compiten entre s铆 para estar un paso por delante del otro. El generador genera claramente contenido (movimientos de labios), mientras que el discriminador es responsable del control de calidad.

    La versi贸n beta est谩 disponible para todos los clientes de suscripci贸n de Rask.

    (Nota del editor: este art铆culo est谩 patrocinado por Rask IA)

    Etiquetas: ai, inteligencia artificial, GAN, Generative Adversarial Network, sincronizaci贸n de labios, rask, rask ai

    鉂 Tambi茅n te interesa:Microsoft presenta el modelo de lenguaje de par谩metros Phi-2, con 2.700 millones de par谩metrosMicrosoft presenta el modelo de lenguaje de par谩metros Phi-2, con 2.700 millones de par谩metros

    Fuente: Ha llegado la sincronizaci贸n de labios con m煤ltiples altavoces mediante IA

    Populares

    M谩s de esta categor铆a

    DEJA UNA RESPUESTA

    Por favor ingrese su comentario!
    Por favor ingrese su nombre aqu铆

    Este sitio usa Akismet para reducir el spam. Aprende c贸mo se procesan los datos de tus comentarios.