M谩s

    MLPerf Inference v3.1 presenta nuevos LLM y puntos de referencia de recomendaci贸n

    - Advertisement -

    La 煤ltima versi贸n de Inferencia de MLPerf presenta nuevos LLM y puntos de referencia de recomendaci贸n, lo que marca un salto adelante en el 谩mbito de las pruebas de IA.

    La iteraci贸n v3.1 del conjunto de pruebas de referencia ha tenido una participaci贸n r茅cord, con m谩s de 13.500 resultados de rendimiento y una mejora de hasta el 40 por ciento en el rendimiento.

    Lo que distingue a este logro es el grupo diverso de 26 participantes diferentes y m谩s de 2000 resultados de potencia, lo que demuestra el amplio espectro de actores de la industria que invierten en innovaci贸n en IA.

    Entre la lista de participantes se encuentran gigantes tecnol贸gicos como Google, Intel y NVIDIA, as铆 como los reci茅n llegados Connect Tech, Nutanix, Oracle y TTA, que participan en el benchmark MLPerf Inference por primera vez.

    David Kanter, director ejecutivo de MLComunesdestac贸 la importancia de este logro:

    鈥淪ometerse a MLPerf no es trivial. Es un logro importante, ya que no se trata de un simple punto de referencia de apuntar y hacer clic. Requiere un trabajo de ingenier铆a real y es un testimonio del compromiso de nuestros remitentes con la IA, con sus clientes y con el ML鈥.

    MLPerf Inference es un conjunto de pruebas de referencia fundamental que mide la velocidad a la que los sistemas de IA pueden ejecutar modelos en diversos escenarios de implementaci贸n. Estos escenarios abarcan desde los 煤ltimos chatbots generativos de IA hasta funciones de mejora de la seguridad en los veh铆culos, como el mantenimiento autom谩tico de carril y las interfaces de voz a texto.

    El foco de atenci贸n de MLPerf Inference v3.1 se centra en la introducci贸n de dos nuevos puntos de referencia:

    • Un LLM que utiliza el GPT-J El modelo de referencia para resumir los art铆culos de noticias de CNN obtuvo presentaciones de 15 participantes diferentes, lo que muestra la r谩pida adopci贸n de la IA generativa.
    • Un punto de referencia de recomendaci贸n actualizado, perfeccionado para alinearse m谩s estrechamente con las pr谩cticas de la industria, emplea el DLRM-DCNv2 modelo de referencia y conjuntos de datos m谩s grandes, atrayendo nueve presentaciones. Estos nuevos puntos de referencia est谩n dise帽ados para ampliar los l铆mites de la IA y garantizar que los puntos de referencia est谩ndar de la industria permanezcan alineados con las 煤ltimas tendencias en la adopci贸n de la IA, sirviendo como una gu铆a valiosa para clientes, proveedores e investigadores por igual.

    Mitchelle Rasquinha, copresidenta del grupo de trabajo de MLPerf Inference, coment贸: 鈥淟as presentaciones para MLPerf Inference v3.1 son indicativas de una amplia gama de aceleradores que se est谩n desarrollando para atender cargas de trabajo de ML.

    鉂 Tambi茅n te interesa:La Casa Blanca obtiene compromisos de seguridad de ocho empresas m谩s de inteligencia artificialLa Casa Blanca obtiene compromisos de seguridad de ocho empresas m谩s de inteligencia artificial

    鈥淓l conjunto de pruebas de referencia actual tiene una amplia cobertura entre los dominios de ML, y la incorporaci贸n m谩s reciente de GPT-J es una contribuci贸n bienvenida al espacio de la IA generativa. Los resultados deber铆an ser muy 煤tiles para los usuarios a la hora de seleccionar los mejores aceleradores para sus respectivos dominios鈥.

    Los puntos de referencia de MLPerf Inference se centran principalmente en centros de datos y sistemas de borde. Las presentaciones de la versi贸n 3.1 muestran varios procesadores y aceleradores en casos de uso en visi贸n por computadora, sistemas de recomendaci贸n y procesamiento de lenguaje.

    El conjunto de pruebas comparativas abarca presentaciones abiertas y cerradas en las categor铆as de rendimiento, potencia y redes. Las presentaciones cerradas emplean el mismo modelo de referencia para garantizar la igualdad de condiciones en todos los sistemas, mientras que los participantes de la divisi贸n abierta pueden presentar una variedad de modelos.

    A medida que la IA contin煤a impregnando varios aspectos de nuestras vidas, los puntos de referencia de MLPerf sirven como herramientas vitales para evaluar y dar forma al futuro de la tecnolog铆a de IA.

    Encuentre los resultados detallados de MLPerf Inference v3.1 aqu铆.

    (Foto por Mauro Sbicego en desempaquetar)

    Ver tambi茅n: GitLab: los desarrolladores ven la IA como 芦esencial禄 a pesar de las preocupaciones

    驴Quiere aprender m谩s sobre IA y big data de la mano de los l铆deres de la industria? Verificar Exposici贸n de IA y Big Data que tendr谩 lugar en Amsterdam, California y Londres. El evento integral comparte ubicaci贸n con Semana de la Transformaci贸n Digital.

    鉂 Tambi茅n te interesa:Stability AI presenta el modelo ‘Stable Audio’ para generaci贸n de audio controlableStability AI presenta el modelo ‘Stable Audio’ para generaci贸n de audio controlable

    Explore otros pr贸ximos eventos y seminarios web de tecnolog铆a empresarial impulsados 鈥嬧媝or TechForge aqu铆.

    • ryan daws

      Ryan es editor senior en TechForge Media con m谩s de una d茅cada de experiencia cubriendo la 煤ltima tecnolog铆a y entrevistando a figuras l铆deres de la industria. A menudo se le puede ver en conferencias tecnol贸gicas con un caf茅 fuerte en una mano y una computadora port谩til en la otra. Si es geek, probablemente le guste. Encu茅ntrelo en Twitter (@Gadget_Ry) o Mastodon (@[email protected])

      Ver todas las publicaciones

    Etiquetas: ai, aprendizaje autom谩tico, inteligencia artificial, punto de referencia, gpt-j, inferencia, modelo de lenguaje grande, llm, mlcommons, mlperf, inferencia mlperf, pruebas

    Fuente: MLPerf Inference v3.1 presenta nuevos LLM y puntos de referencia de recomendaci贸n

    鉂 Tambi茅n te interesa:Google Gemini: Lo que sabemos hasta ahoraGoogle Gemini: Lo que sabemos hasta ahora

    Populares

    M谩s de esta categor铆a

    DEJA UNA RESPUESTA

    Por favor ingrese su comentario!
    Por favor ingrese su nombre aqu铆

    Este sitio usa Akismet para reducir el spam. Aprende c贸mo se procesan los datos de tus comentarios.