M谩s

    Meta presenta el modelo de traducci贸n multimodal SeamlessM4T

    - Advertisement -

    Los metainvestigadores han revelado Sin costuraM4Tun modelo pionero multiling眉e y multitarea que facilita la traducci贸n y transcripci贸n fluidas tanto de voz como de texto.

    Internet, los dispositivos m贸viles, las redes sociales y las plataformas de comunicaci贸n han marcado el comienzo de una era en la que el acceso a contenidos multiling眉es ha alcanzado niveles sin precedentes. SeamlessM4T tiene como objetivo hacer realidad la visi贸n de una comunicaci贸n y comprensi贸n fluidas en todos los idiomas.

    Con una impresionante variedad de capacidades, SeamlessM4T abarca:

    • Reconocimiento autom谩tico de voz para casi 100 idiomas
    • Traducci贸n de voz a texto compatible con casi 100 idiomas de entrada y salida
    • Traducci贸n de voz a voz para casi 100 idiomas de entrada y 35 idiomas de salida (incluido el ingl茅s)
    • Traducci贸n de texto a texto para casi 100 idiomas
    • Traducci贸n de texto a voz para casi 100 idiomas de entrada y 35 idiomas de salida (incluido el ingl茅s)

    SeamlessM4T se pone a disposici贸n de investigadores y desarrolladores bajo el CC BY-NC 4.0 licencia, que encarna un esp铆ritu de ciencia abierta.

    Adem谩s, se han publicado los metadatos de SeamlessAlign, el conjunto de datos de traducci贸n multimodal m谩s grande jam谩s compilado, que consta de 270.000 horas de alineaciones de voz y texto extra铆das. Esto facilita la extracci贸n de datos independiente y una mayor investigaci贸n dentro de la comunidad.

    El desarrollo de SeamlessM4T aborda un desaf铆o de larga data en el campo de la comunicaci贸n multiling眉e. A diferencia de los sistemas anteriores, que estaban limitados por una cobertura ling眉铆stica limitada y la dependencia de subsistemas separados, SeamlessM4T presenta un modelo unificado capaz de manejar de manera integral tareas de traducci贸n de voz a voz y de voz a texto.

    Meta se ha basado en innovaciones anteriores, como Ning煤n idioma se queda atr谩s (NLLB) y Traductor de voz universal 鈥 crear este modelo multiling眉e unificado. Con su impresionante desempe帽o en lenguajes de bajos recursos y su desempe帽o consistentemente s贸lido en lenguajes de altos recursos, SeamlessM4T tiene el potencial de revolucionar la comunicaci贸n entre idiomas.

    La arquitectura del modelo se basa en el modelo UnitY multitarea, que sobresale en la generaci贸n de texto y voz traducidos.

    UnitY admite diversas tareas de traducci贸n, incluido el reconocimiento autom谩tico de voz, la traducci贸n de texto a texto y la traducci贸n de voz a voz, todo desde un solo modelo. Para entrenar este modelo vers谩til, Meta emple贸 t茅cnicas avanzadas como codificadores de texto y voz, codificadores autosupervisados 鈥嬧媦 procesos de decodificaci贸n sofisticados.

    鉂 Tambi茅n te interesa:OpenAI presenta ajustes para GPT-3.5 Turbo y GPT-4OpenAI presenta ajustes para GPT-3.5 Turbo y GPT-4

    El resultado es un modelo que supera a los l铆deres anteriores:

    Para garantizar la precisi贸n y seguridad del sistema, Meta se adhiere a un marco de IA responsable.

    Meta dice que se ha realizado una investigaci贸n exhaustiva sobre la toxicidad y la mitigaci贸n de sesgos, lo que ha dado como resultado un modelo que es m谩s consciente y receptivo a los problemas potenciales. El lanzamiento p煤blico del modelo SeamlessM4T fomenta la investigaci贸n y el desarrollo colaborativos en la comunidad de IA.

    A medida que el mundo se vuelve m谩s conectado, la capacidad de SeamlessM4T para trascender las barreras del idioma es un testimonio del poder de la innovaci贸n impulsada por la IA. Este hito nos acerca a un futuro donde la comunicaci贸n no conoce limitaciones ling眉铆sticas, permitiendo un mundo donde las personas realmente puedan entenderse entre s铆 independientemente del idioma.

    Puede encontrar una demostraci贸n de SeamlessM4T aqu铆. El c贸digo, modelo y datos se pueden descargar. en GitHub.

    (Credito de imagen: Meta IA)

    Ver tambi茅n: Un estudio destaca el impacto de la demograf铆a en el entrenamiento de IA

    馃摲 Meta presenta el modelo de traduccion multimodal SeamlessM4T

    鉂 Tambi茅n te interesa:Basil Faruqui, BMC: Por qu茅 DataOps necesita orquestaci贸n para que funcioneBasil Faruqui, BMC: Por qu茅 DataOps necesita orquestaci贸n para que funcione

    驴Quiere aprender m谩s sobre IA y big data de la mano de los l铆deres de la industria? Verificar Exposici贸n de IA y Big Data que tendr谩 lugar en 脕msterdam, California y Londres. El evento integral comparte ubicaci贸n con Semana de la Transformaci贸n Digital.

    Explore otros pr贸ximos eventos y seminarios web de tecnolog铆a empresarial impulsados 鈥嬧媝or TechForge aqu铆.

    • ryan daws

      Ryan es editor senior en TechForge Media con m谩s de una d茅cada de experiencia cubriendo la 煤ltima tecnolog铆a y entrevistando a figuras l铆deres de la industria. A menudo se le puede ver en conferencias tecnol贸gicas con un caf茅 fuerte en una mano y una computadora port谩til en la otra. Si es geek, probablemente le guste. Encu茅ntrelo en Twitter (@Gadget_Ry) o Mastodon (@[email protected])

      Ver todas las publicaciones

    Etiquetas: meta, modelo, nllb, Seamlessalign, Seamlessm4t, traducci贸n, modelo de unidad

    鉂 Tambi茅n te interesa:Los ataques de ‘inyecci贸n r谩pida’ de chatbot plantean un riesgo de seguridad crecienteLos ataques de ‘inyecci贸n r谩pida’ de chatbot plantean un riesgo de seguridad creciente

    Fuente: Meta presenta el modelo de traducci贸n multimodal SeamlessM4T

    Populares

    M谩s de esta categor铆a

    DEJA UNA RESPUESTA

    Por favor ingrese su comentario!
    Por favor ingrese su nombre aqu铆

    Este sitio usa Akismet para reducir el spam. Aprende c贸mo se procesan los datos de tus comentarios.