Investigadores de Google DeepMind y el Universidad del Sur de California.
Su nuevo marco de estímulo ‘AUTODESCUBRIMIENTO’, publicado esta semana en arXiV y abrazando la cara – representa un salto significativo más allá de las técnicas existentes, revolucionando potencialmente el rendimiento de modelos líderes como OpenAI. GPT-4 y de google Palma 2.
El marco promete mejoras sustanciales al abordar tareas de razonamiento desafiantes. Demuestra mejoras notables, con un aumento de rendimiento de hasta un 32 % en comparación con métodos tradicionales como Chain of Thought (CoT). Este novedoso enfoque gira en torno a que los LLM descubran de forma autónoma estructuras de razonamiento intrínsecas a las tareas para afrontar problemas complejos.
En esencia, el marco permite a los LLM autodescubrir y utilizar varios módulos de razonamiento atómico, como el pensamiento crítico y el análisis paso a paso, para construir estructuras de razonamiento explícito.
Al imitar las estrategias humanas de resolución de problemas, el marco opera en dos etapas:
- La primera etapa implica componer una estructura de razonamiento coherente intrínseca a la tarea, aprovechando un conjunto de módulos de razonamiento atómico y ejemplos de tareas.
- Durante la decodificación, los LLM siguen esta estructura autodescubierta para llegar a la solución final.
En pruebas exhaustivas de varias tareas de razonamiento (entre ellas Big-Bench Hard, Thinking for Doing y Math), el enfoque de autodescubrimiento superó consistentemente a los métodos tradicionales. En particular, logró una precisión del 81 %, 85 % y 73 % en las tres tareas con GPT-4, superando las técnicas de cadena de pensamiento y de planificación y resolución.
Sin embargo, las implicaciones de esta investigación van mucho más allá de las meras mejoras en el rendimiento.
Al equipar a los LLM con capacidades de razonamiento mejoradas, el marco allana el camino para abordar problemas más desafiantes y acerca la IA al logro de la inteligencia general. Los estudios de transferibilidad realizados por los investigadores resaltan aún más la aplicabilidad universal de las estructuras de razonamiento compuestas, alineándose con los patrones de razonamiento humano.
A medida que el panorama evoluciona, avances como el marco de estímulo SELF-DISCOVER representan hitos cruciales en el avance de las capacidades de los modelos de lenguaje y ofrecen una visión del futuro de la IA.
(Foto por Víctor en desempaquetar)
Ver también: El Reino Unido está superando a los EE. UU. en contratación de IA
¿Quiere aprender más sobre IA y big data de la mano de los líderes de la industria? Verificar Exposición de IA y Big Data que tendrá lugar en Amsterdam, California y Londres. El evento integral comparte ubicación con Semana de la Transformación Digital y Exposición de seguridad cibernética y nube.
Explore otros próximos eventos y seminarios web de tecnología empresarial impulsados por TechForge aquí.
Fuente: El marco DeepMind ofrece un gran avance en el razonamiento de los LLM