Ladrillos de datos ha anunciado el lanzamiento de DBRX, un nuevo y potente modelo de lenguaje grande de código abierto que, según afirma, establece un nuevo estándar para los modelos abiertos al superar a opciones establecidas como GPT-3.5 en los puntos de referencia de la industria.
La compañía dice que el modelo DBRX de 132 mil millones de parámetros supera a los LLM populares de código abierto como LLaMA 2 70B, Mixtral y Grok-1 en tareas de comprensión de lenguajes, programación y matemáticas. Incluso supera al modelo de código cerrado de Anthropic, Claude, en ciertos puntos de referencia.
DBRX demostró un rendimiento de vanguardia entre los modelos abiertos en tareas de codificación, superando a modelos especializados como CodeLLaMA a pesar de ser un LLM de propósito general. También igualó o superó GPT-3.5 en casi todos los puntos de referencia evaluados.
Las capacidades de última generación se deben a una arquitectura de combinación de expertos más eficiente que hace que DBRX sea hasta 2 veces más rápido en inferencia que LLaMA 2 70B, a pesar de tener menos parámetros activos. Databricks afirma que entrenar el modelo también fue aproximadamente 2 veces más eficiente en computación que las alternativas densas.
«DBRX está estableciendo un nuevo estándar para los LLM de código abierto: brinda a las empresas una plataforma para crear capacidades de razonamiento personalizadas basadas en sus propios datos», dijo Ali Ghodsi, cofundador y director ejecutivo de Databricks.
DBRX fue entrenado previamente con una enorme cantidad de 12 billones de tokens de texto «cuidadosamente seleccionado» y datos de código seleccionados para mejorar la calidad. Aprovecha tecnologías como codificaciones de posición rotatoria y aprendizaje curricular durante la capacitación previa.
Los clientes pueden interactuar con DBRX a través de API o utilizar las herramientas de la empresa para ajustar el modelo con sus datos patentados. Ya se está integrando en los productos de inteligencia artificial de Databricks.
«Nuestra investigación muestra que las empresas planean gastar la mitad de sus presupuestos de IA en IA generativa», dijo Dave Menninger, director ejecutivo de Ventana Research, parte de ISG. “Uno de los tres principales desafíos que enfrentan es la seguridad y privacidad de los datos.
“Con su plataforma de inteligencia de datos de extremo a extremo y la introducción de DBRX, Databricks permite a las empresas crear aplicaciones de inteligencia artificial generativas que estén gobernadas, seguras y adaptadas al contexto de su negocio, al tiempo que mantienen el control y la propiedad de su propiedad intelectual a lo largo del proceso. forma.»
Socios como Accenture, Block, Nasdaq, Prosus, Replit y Zoom elogiaron el potencial de DBRX para acelerar la adopción empresarial de grandes modelos lingüísticos abiertos y personalizados. Los analistas dijeron que podría impulsar un cambio de código cerrado a código abierto a medida que los modelos abiertos ajustados coincidan con el rendimiento propietario.
Mike O’Rourke, director de IA y servicios de datos de NASDAQ, comentó: “Databricks es un socio clave de Nasdaq en algunos de nuestros sistemas de datos más importantes. Continúan estando a la vanguardia de la industria en la gestión de datos y el aprovechamiento de la IA, y estamos entusiasmados con el lanzamiento de DBRX.
«La combinación de un sólido desempeño del modelo y una economía de servicio favorable es el tipo de innovación que buscamos a medida que aumentamos nuestro uso de IA generativa en Nasdaq».
Puede encontrar la base DBRX y los modelos optimizados en abrazando la cara. Los proyectos GitHub tiene más recursos y ejemplos de código.
(Foto por Ryan Quintal)
Ver también: Los grandes modelos lingüísticos podrían «revolucionar el sector financiero en dos años»
¿Quiere aprender más sobre IA y big data de la mano de los líderes de la industria? Verificar Exposición de IA y Big Data que tendrá lugar en Amsterdam, California y Londres. El evento integral comparte ubicación con otros eventos importantes, incluidos bloquex, Semana de la Transformación Digitaly Exposición de seguridad cibernética y nube.
Explore otros próximos eventos y seminarios web de tecnología empresarial impulsados por TechForge aquí.
Fuente: Databricks afirma que DBRX establece «un nuevo estándar» para los LLM de código abierto