Meta ha presentado Llama 2una familia de código abierto de modelos de lenguaje de IA que viene con una licencia que permite la integración en productos comerciales.
Los modelos Llama 2 varían en tamaño de 7 a 70 mil millones de parámetros, lo que los convierte en una fuerza formidable en el panorama de la IA.
Según las afirmaciones de Meta, estos modelos «superan a los modelos de chat de código abierto en la mayoría de los puntos de referencia que probamos».
El lanzamiento de Llama 2 marca un punto de inflexión en el mercado LLM (modelo de lenguaje grande) y ya ha llamado la atención de expertos y entusiastas de la industria por igual.
Los nuevos modelos de lenguaje que ofrece Llama 2 vienen en dos variantes: preentrenados y ajustados:
- Los modelos preentrenados están entrenados en la friolera de dos billones de tokens y tienen una ventana de contexto de 4096 tokens, lo que les permite procesar grandes cantidades de contenido a la vez.
- Los modelos ajustados, diseñados para aplicaciones de chat como ChatGPT, han sido entrenados en «más de un millón de anotaciones humanas», mejorando aún más sus capacidades de procesamiento de lenguaje.
Si bien el rendimiento de Llama 2 aún no puede competir con el GPT-4 de OpenAI, muestra una promesa notable para un modelo de código abierto.
¡La esperada secuela, Llama-2, se anuncia hoy! Es el mejor modelo OSS que tenemos ahora.
▸ Niveles: 7B, 13B, 70B. Contexto: 4K
▸ 70B está cerca de GPT-3.5 en tareas de razonamiento, pero hay una brecha significativa en los puntos de referencia de codificación. Está a la par o mejor que PaLM-540B en la mayoría… pic.twitter.com/qiQr4NsuxC
—Jim Fan (@DrJimFan) 18 de julio de 2023
El viaje de Llama 2 comenzó con su predecesor, LLaMA, que Meta lanzó como código abierto con una licencia no comercial en febrero.
Sin embargo, alguien filtró los pesos de LLaMA a los sitios de torrents, lo que provocó un aumento en su uso dentro de la comunidad de IA. Esto sentó las bases para una escena de desarrollo de LLM clandestina de rápido crecimiento.
Los modelos de IA de código abierto como Llama 2 vienen con su parte de ventajas y preocupaciones.
En el lado positivo, fomentan la transparencia en términos de datos de capacitación, fomentan la competencia económica, promueven la libertad de expresión y democratizan el acceso a la IA. Sin embargo, los críticos señalan riesgos potenciales, como el mal uso de la biología sintética, la generación de spam o la desinformación.
Para abordar tales preocupaciones, Meta emitió una declaración en apoyo de su enfoque de innovación abierta, enfatizando que la innovación abierta y responsable fomenta la transparencia y la confianza en las tecnologías de IA.
A pesar de los beneficios de los modelos de código abierto, algunos críticos siguen siendo escépticos, especialmente con respecto a la falta de transparencia en los datos de capacitación utilizados para los LLM. Si bien Meta afirma haber hecho esfuerzos para eliminar los datos que contienen información personal, las fuentes específicas de los datos de capacitación siguen sin revelarse, lo que genera preocupaciones sobre la privacidad y las consideraciones éticas.
Con la combinación de desarrollo de código abierto y licencias comerciales, Llama 2 promete brindar avances y oportunidades emocionantes a la comunidad de IA al mismo tiempo que enfrenta los desafíos de la privacidad de datos y el uso responsable.
(Foto por Joakim Honkasalo en Unsplash)
Ver también: Anthropic lanza su rival ChatGPT Claude 2
¿Quiere aprender más sobre IA y big data de los líderes de la industria? Verificar Exposición de IA y Big Data teniendo lugar en Ámsterdam, California y Londres. El evento es co-ubicado con Semana de la Transformación Digital.
Explore otros próximos eventos y seminarios web de tecnología empresarial impulsados por TechForge aquí.
Fuente: Meta lanza Llama 2 LLM de código abierto