La investigación de LG AI ha presentado Exaone Deep, un modelo de razonamiento que sobresale en la resolución de problemas complejos entre matemáticas, ciencias y codificación.
La compañía destacó el desafío global en la creación de modelos de razonamiento avanzados, señalando que actualmente, solo un puñado de organizaciones con modelos fundamentales persiguen activamente esta área compleja. Exaone Deep tiene como objetivo competir directamente con estos modelos principales, mostrando un nivel competitivo de capacidad de razonamiento.
La investigación de LG AI ha centrado sus esfuerzos en mejorar drásticamente las capacidades de razonamiento de Exaone Deep en los dominios centrales. El modelo también demuestra una fuerte capacidad para comprender y aplicar conocimiento en una gama más amplia de sujetos.
Los puntos de referencia de rendimiento publicados por LG AI Research son impresionantes:
- Matemáticas: El modelo Exaone Deep 32B superó a un modelo competidor, a pesar de ser solo el 5% de su tamaño, en un punto de referencia de matemáticas exigente. Además, las versiones 7.8B y 2.4B lograron el primer lugar en todos los principales puntos de referencia de matemáticas para sus respectivos tamaños de modelo.
- Ciencia y codificación: En estas áreas, los modelos Exaone Deep (7.8B y 2.4B) han asegurado el primer lugar en todos los principales puntos de referencia.
- MMLU (comprensión de lenguaje multitarea masiva): El modelo 32B logró una puntuación de 83.0 en el punto de referencia MMLU, que LG AI Research afirma es el mejor desempeño entre los modelos coreanos nacionales.
Las capacidades del modelo Exaone Deep 32B ya han obtenido el reconocimiento internacional.
Poco después de su lanzamiento, se incluyó en la lista de «modelos de IA notables» de la organización de investigación sin fines de lucro con sede en Estados Unidos. Época AI. Este listado coloca a Exaone profundamente junto a su predecesor, Exaone 3.5, convirtiendo a LG en la única entidad coreana con modelos presentados en esta prestigiosa lista en los últimos dos años.
Destreza de matemáticas
Exaone Deep ha demostrado habilidades de razonamiento matemático excepcionales en sus diversos tamaños de modelo (32b, 7.8b y 2.4b). En las evaluaciones basadas en el plan de estudios de matemáticas del año académico 2025, los tres modelos superaron a los modelos de razonamiento global de tamaño comparable.
El modelo 32B logró una puntuación de 94.5 en una prueba de competencia de matemáticas generales y 90.0 en el American Invitational Mathematics Examination (AIME) 2024, un examen de calificación para la Olimpiada Matemática de los Estados Unidos.
En el AIME 2025, el modelo 32B coincidió con el rendimiento de Deepseek-R1, un modelo 671B significativamente mayor. Este resultado muestra el aprendizaje eficiente de Exaone Deep y las fuertes habilidades de razonamiento lógico, particularmente al abordar problemas matemáticos desafiantes.
Los modelos más pequeños de 7.8B y 2.4B también lograron clasificaciones superiores en los principales puntos de referencia para modelos livianos y en dispositivos, respectivamente. El modelo 7.8B obtuvo 94.8 en el punto de referencia Math-500 y 59.6 en AIME 2025, mientras que el modelo 2.4B logró puntajes de 92.3 y 47.9 en las mismas evaluaciones.
Excelencia en ciencia y codificación
Exaone Deep también ha mostrado capacidades notables en razonamiento y codificación de software de ciencias profesionales.
El modelo 32B obtuvo 66.1 en la prueba de diamantes GPQA, que evalúa las habilidades de resolución de problemas en física, química y biología a nivel doctoral. En la evaluación de LivecodeBench, que mide la competencia de codificación, el modelo logró una puntuación de 59.5, lo que indica su potencial para aplicaciones de alto nivel en estos dominios expertos.
Los modelos 7.8B y 2.4B continuaron esta tendencia de rendimiento fuerte, ambos asegurando el primer lugar en los puntos de referencia GPQA Diamond y LivecodeBench dentro de sus respectivas categorías de tamaño. Este logro se basa en el éxito del modelo Exaone 3.5 2.4b, que superó previamente la tabla de lectura LLM de Hugging Face en la división de borde.
Conocimiento general mejorado
Más allá de sus capacidades de razonamiento especializado, Exaone Deep también ha demostrado un mejor rendimiento en la comprensión general del conocimiento.
El modelo 32B logró una puntuación impresionante de 83.0 en el punto de referencia MMLU, posicionándolo como el modelo nacional de alto rendimiento en esta evaluación integral. Esto indica que las mejoras de razonamiento de Exaone Deep se extienden más allá de dominios específicos y contribuyen a una comprensión más amplia de varios sujetos.
LG AI Research cree que los avances de razonamiento de Exaone Deep representan un salto hacia un futuro en el que la IA puede abordar problemas cada vez más complejos y contribuir a enriquecer y simplificar la vida humana a través de la investigación y la innovación continuas.
Ver también: Baidu socava modelos AI rivales con Ernie 4.5 y Ernie X1
¿Quiere obtener más información sobre AI y Big Data de los líderes de la industria? Verificar AI y Big Data Expo que tiene lugar en Amsterdam, California y Londres. El evento integral está ubicado en otros eventos líderes, incluidos Conferencia de automatización inteligente, Bloqueo, Semana de transformación digitaly Cyber Security & Cloud Expo.
Explore otros próximos eventos y seminarios web tecnológicos empresariales con TechForge aquí.
Fuente: LG Exaone Deep es un aficionado a las matemáticas, ciencias y codificación