Mistral AI ha retirado la cortina sobre Magistral, su primer modelo construido específicamente para tareas de razonamiento.
Magistral llega en dos sabores: una versión de código abierto de parámetros de 24B llamada Magistral Small con la que cualquiera puede jugar, y una edición empresarial más robusta, Magistral Medium, dirigida a aplicaciones comerciales donde las capacidades de razonamiento avanzadas son más importantes.
«El mejor pensamiento humano no es lineal: teje a través de la lógica, la perspicacia, la incertidumbre y el descubrimiento», explica la IA Mistral.
Ese es un punto justo, los modelos existentes a menudo luchan con la forma desordenada y no lineal que los humanos realmente piensan en los problemas. He probado numerosos modelos de razonamiento y generalmente sufren tres limitaciones clave: carecen de profundidad en dominios especializados, su proceso de pensamiento es frustrantemente opaco y funcionan de manera inconsistente en diferentes idiomas.
Razonamiento del mundo real de Mistral AI para profesionales
Para los profesionales que han dudado en confiar en la IA con tareas complejas, Magistral podría cambiar algunas mentes.
Las águilas legales, la gente financiera, los profesionales de la salud y los trabajadores del gobierno apreciarán la capacidad del modelo para mostrar su trabajo. Todas las conclusiones se pueden rastrear a través de pasos lógicos, cruciales cuando está operando en entornos regulados donde «porque la IA lo dijo» simplemente no lo corta.
Los desarrolladores de software tampoco han sido olvidados. Magistral afirma brillar en el tipo de pensamiento estructurado que hace una mejor planificación de proyectos, diseño de arquitectura e ingeniería de datos. Después de haber luchado con algunos modelos que producen soluciones técnicas de su sonido plausible pero defectuoso, estoy ansioso por ver si las capacidades de razonamiento de Magistral entregan en este frente.
Mistral afirma que su modelo de razonamiento también se destaca en tareas creativas. La compañía informa que Magistral es «un excelente compañero creativo» para escribir y contar historias, capaz de producir narraciones coherentes y, cuando se le pide, más contenido experimental. Esta versatilidad sugiere que nos estamos moviendo más allá de la era de tener modelos separados para tareas creativas versus lógicas.
¿Qué separa el magistral del resto?
Lo que separa los modelos Magistrales de los modelos de lenguaje actuales es la transparencia. En lugar de simplemente escupir respuestas de una caja negra, revela su proceso de pensamiento de una manera que los usuarios pueden seguir y verificar.
Esto importa enormemente en contextos profesionales. Un abogado no solo quiere una sugerencia de cláusula de contrato; Necesitan comprender el razonamiento legal detrás de él. Un médico no puede confiar ciegamente en una sugerencia de diagnóstico sin ver la lógica clínica. Al hacer su razonamiento rastreable, Magistral podría ayudar a cerrar la brecha de confianza que se ha reducido a la adopción de IA en campos de alto riesgo.
Habiendo hablado con desarrolladores de IA no inglés, he escuchado una frustración constante sobre cómo las capacidades de razonamiento se desprenden dramáticamente fuera del inglés. Magistral parece abordar este frente con un apoyo multilingüe robusto, lo que permite a los profesionales razonar en su lenguaje preferido sin penalizaciones de rendimiento.
No se trata solo de conveniencia; Se trata de equidad y acceso. A medida que los países implementan cada vez más regulaciones de IA que requieren soluciones localizadas, las herramientas que razonan de manera efectiva a través de los idiomas tendrán una ventaja significativa sobre los competidores centrados en el inglés.
Poniendo en tus manos Magistral
Para aquellos que desean experimentar, Magistral Small está disponible ahora bajo la licencia Apache 2.0 a través de la cara abrazada. Aquellos interesados en la versión media más potente pueden probar una vista previa a través de la interfaz LE de chat de Mistral o a través de su plataforma API.
Los usuarios empresariales que buscan opciones de implementación pueden encontrar medios magistrales en Amazon Sagemaker, con IBM Watsonx, Azure y Google Cloud Marketplace Instementations Llegada.
A medida que la emoción inicial en torno a los chatbots de uso general comienza a disminuir, el mercado tiene hambre de herramientas de IA especializadas que se destacan en tareas profesionales específicas. Al centrarse en el razonamiento transparente para expertos en dominios, Mistral ha forjado un nicho potencialmente valioso.
Fundada el año pasado por ex alumnos de Deepmind y Meta AI, Mistral se ha movido a velocidad vertiginosa para establecerse como campeón de IA de Europa. Se han perforado constantemente por encima de su peso, creando modelos que compiten con las ofertas de empresas muchas veces su tamaño.
A medida que las organizaciones exigen cada vez más IA que pueda explicarse, particularmente en Europa, donde la Ley de IA requerirá transparencia, el enfoque de Magistral en mostrar su proceso de razonamiento se siente particularmente oportuno.
(Imagen por Stephane)
Ver también: Abordando alucinaciones: el spinot del MIT enseña a la IA a admitir cuándo no tiene idea
¿Quiere obtener más información sobre AI y Big Data de los líderes de la industria? Verificar AI y Big Data Expo que tiene lugar en Amsterdam, California y Londres. El evento integral está ubicado en otros eventos líderes, incluidos Conferencia de automatización inteligente, Bloqueo, Semana de transformación digitaly Cyber Security & Cloud Expo.
Explore otros próximos eventos y seminarios web tecnológicos empresariales con TechForge aquí.
Fuente: Mistral AI desafía a Big Tech con el modelo de razonamiento