Meta ha introducido Llama 3, la próxima generación de su modelo de lenguaje grande (LLM) de código abierto de última generación. El gigante tecnológico afirma que Llama 3 establece nuevos puntos de referencia de rendimiento, superando modelos anteriores líderes en la industria como GPT-3.5 en escenarios del mundo real.
«Con Llama 3, nos propusimos construir los mejores modelos abiertos que estén a la par con los mejores modelos propietarios disponibles en la actualidad», dijo Meta en una publicación de blog anunciando el lanzamiento.
Los modelos iniciales de Llama 3 que se están abriendo son versiones de 8 mil millones y 70 mil millones de parámetros. Meta dice que sus equipos todavía están entrenando modelos de parámetros más grandes de más de 400 mil millones que se publicarán en los próximos meses, junto con artículos de investigación que detallan el trabajo.
Llama 3 lleva más de dos años en desarrollo con importantes recursos dedicados a reunir datos de capacitación de alta calidad, ampliar la capacitación distribuida, optimizar la arquitectura del modelo y enfoques innovadores para el ajuste de la instrucción.
El modelo ajustado de instrucción de 70 mil millones de parámetros de Meta superó a GPT-3.5, Claude y otros LLM de escala comparable en evaluaciones humanas en 12 escenarios de uso clave como codificación, razonamiento y escritura creativa. El modelo preentrenado de 8 mil millones de parámetros de la compañía también establece nuevos puntos de referencia en tareas populares de evaluación de LLM:
«Creemos que estos son los mejores modelos de código abierto de su clase, punto», afirmó Meta.
El gigante tecnológico está lanzando los modelos a través de un enfoque «abierto por defecto» para promover un ecosistema abierto en torno al desarrollo de la IA. Llama 3 estará disponible en los principales proveedores de nube, hosts de modelos, fabricantes de hardware y plataformas de inteligencia artificial.
Victor Botev, CTO y cofundador de Iris.ai, dijo: “Con el cambio global hacia la regulación de la IA, el lanzamiento del modelo Llama 3 de Meta es notable. Al adoptar la transparencia a través del código abierto, Meta se alinea con el creciente énfasis en las prácticas responsables de IA y el desarrollo ético.
«Además, esto brinda la oportunidad de una educación comunitaria más amplia, ya que los modelos abiertos facilitan la comprensión del desarrollo y la capacidad de examinar diversos enfoques, y esta transparencia se retroalimenta en la redacción y aplicación de la regulación».
Acompañando a los últimos modelos de Meta hay un conjunto actualizado de herramientas de seguridad de IA, incluidas las segundas versiones de Llama Guard para clasificar riesgos y CyberSec Eval para evaluar posibles usos indebidos. También se introdujo un nuevo componente llamado Code Shield para filtrar sugerencias de código inseguro en el momento de la inferencia.
«Sin embargo, es importante mantener la perspectiva: un modelo que simplemente sea de código abierto no equivale automáticamente a una IA ética», continuó Botev. “Abordar los desafíos de la IA requiere un enfoque integral para abordar cuestiones como la privacidad de los datos, el sesgo algorítmico y los impactos sociales, todos ellos focos clave de las regulaciones emergentes sobre la IA en todo el mundo.
”Si bien iniciativas abiertas como Llama 3 promueven el escrutinio y la colaboración, su verdadero impacto depende de un enfoque holístico para el cumplimiento de la gobernanza de la IA y la incorporación de la ética en los ciclos de vida de los sistemas de IA. Los continuos esfuerzos de Meta con el modelo Llama son un paso en la dirección correcta, pero la IA ética exige un compromiso sostenido de todas las partes interesadas”.
Meta dice que ha adoptado un «enfoque a nivel de sistema» para el desarrollo y la implementación responsable de la IA con Llama 3. Si bien los modelos han sido sometidos a extensas pruebas de seguridad, la compañía enfatiza que los desarrolladores deben implementar su propio filtrado de entrada/salida de acuerdo con los requisitos de su aplicación. .
El producto de usuario final de la compañía que integra Llama 3 es Meta AI, que según Meta es ahora el asistente de inteligencia artificial líder en el mundo gracias a los nuevos modelos. Los usuarios pueden acceder a Meta AI a través de Facebook, Instagram, WhatsApp, Messenger y el web para productividad, aprendizaje, creatividad y consultas generales.
Las versiones multimodales de Meta AI que integran capacidades de visión están en camino, con una vista previa de las gafas inteligentes Ray-Ban de Meta.
A pesar de los considerables logros de Llama 3, algunos en el campo de la IA han expresado escepticismo sobre la motivación de Meta como un enfoque abierto «por el bien de la sociedad».
Sin embargo, apenas un día después de que Mistral AI estableciera un nuevo punto de referencia para los modelos de código abierto con Mixtral 8x22B, el lanzamiento de Meta vuelve a elevar el listón para los LLM disponibles abiertamente.
Ver también: SAS tiene como objetivo hacer que la IA sea accesible independientemente del conjunto de habilidades con modelos de IA empaquetados
¿Quiere aprender más sobre IA y big data de la mano de los líderes de la industria? Verificar Exposición de IA y Big Data que tendrá lugar en Amsterdam, California y Londres. El evento integral comparte ubicación con otros eventos importantes, incluidos bloquex, Semana de la Transformación Digitaly Exposición de seguridad cibernética y nube.
Explore otros próximos eventos y seminarios web de tecnología empresarial impulsados por TechForge aquí.
Fuente: Meta sube el listón con Llama 3 LLM de código abierto