M谩s

    Amazon entrena LLM de par谩metros 980M con ‘habilidades emergentes’

    - Advertisement -

    Investigadores de Amazon han entrenado un nuevo modelo de lenguaje grande (LLM) para conversi贸n de texto a voz que, seg煤n afirman, exhibe habilidades 芦emergentes禄.

    El modelo de 980 millones de par谩metros, llamado BASE TTS, es el modelo de conversi贸n de texto a voz m谩s grande creado hasta ahora. Los investigadores entrenaron modelos de varios tama帽os con hasta 100.000 horas de datos de voz de dominio p煤blico para ver si observaban los mismos saltos de rendimiento que se producen en los modelos de procesamiento del lenguaje natural una vez que superan una determinada escala.

    Descubrieron que su modelo de tama帽o mediano de 400 millones de par谩metros (entrenado con 10.000 horas de audio) mostraba una marcada mejora en versatilidad y robustez en oraciones de prueba dif铆ciles.

    Las oraciones de prueba conten铆an caracter铆sticas l茅xicas, sint谩cticas y paraling眉铆sticas complejas, como sustantivos compuestos, emociones, palabras extranjeras y puntuaci贸n que normalmente hacen tropezar los sistemas de conversi贸n de texto a voz. Si bien BASE TTS no los manej贸 a la perfecci贸n, cometi贸 muchos menos errores de acentuaci贸n, entonaci贸n y pronunciaci贸n que los modelos existentes.

    芦Estas oraciones est谩n dise帽adas para contener tareas desafiantes, ninguna de las cuales BASE TTS est谩 capacitado expl铆citamente para realizar禄, explicaron los investigadores.

    鉂 Tambi茅n te interesa:Google lanza Gemini 1.5 con un contexto de token ‘experimental’ de 1 mill贸nGoogle lanza Gemini 1.5 con un contexto de token ‘experimental’ de 1 mill贸n

    La versi贸n m谩s grande del modelo, con 980 millones de par谩metros, entrenada con 100.000 horas de audio, no demostr贸 m谩s capacidades m谩s all谩 de la versi贸n de 400 millones de par谩metros.

    Si bien es un proceso experimental, la creaci贸n de BASE TTS demuestra que estos modelos pueden alcanzar nuevos umbrales de versatilidad a medida que escalan, una se帽al alentadora para la IA conversacional. Los investigadores planean seguir trabajando para identificar el tama帽o 贸ptimo del modelo para habilidades emergentes.

    El modelo tambi茅n est谩 dise帽ado para ser liviano y transmitible, y empaqueta datos emocionales y pros贸dicos por separado. Esto podr铆a permitir que el audio hablado con sonido natural se transmita a trav茅s de conexiones de bajo ancho de banda.

    Puede encontrar el art铆culo BASE TTS completo en arXiv aqu铆.

    (Foto por Nik en desempaquetar)

    鉂 Tambi茅n te interesa:Las empresas de telecomunicaciones gastar谩n 20 mil millones de d贸lares en la orquestaci贸n de redes de inteligencia artificial para 2028Las empresas de telecomunicaciones gastar谩n 20 mil millones de d贸lares en la orquestaci贸n de redes de inteligencia artificial para 2028

    Ver tambi茅n: OpenAI implementa la memoria ChatGPT para seleccionar usuarios

    驴Quiere aprender m谩s sobre IA y big data de la mano de los l铆deres de la industria? Verificar Exposici贸n de IA y Big Data que tendr谩 lugar en Amsterdam, California y Londres. El evento integral comparte ubicaci贸n con otros eventos importantes, incluidos bloquex, Semana de la Transformaci贸n Digitaly Exposici贸n de seguridad cibern茅tica y nube.

    Explore otros pr贸ximos eventos y seminarios web de tecnolog铆a empresarial impulsados 鈥嬧媝or TechForge aqu铆.

    Etiquetas: ai, amazon, inteligencia artificial, base tts, ai conversacional, modelo de lenguaje grande, llm

    鉂 Tambi茅n te interesa:Reddit supuestamente vende datos para entrenamiento de IAReddit supuestamente vende datos para entrenamiento de IA

    Fuente: Amazon entrena LLM de par谩metros 980M con ‘habilidades emergentes’

    Populares

    M谩s de esta categor铆a

    DEJA UNA RESPUESTA

    Por favor ingrese su comentario!
    Por favor ingrese su nombre aqu铆

    Este sitio usa Akismet para reducir el spam. Aprende c贸mo se procesan los datos de tus comentarios.