M谩s

    El 煤ltimo modelo de IA de Anthropic supera a sus rivales y logra ser el primero en la industria

    - Advertisement -

    El 煤ltimo modelo de lenguaje de vanguardia de Anthropic, claudio 3se ha adelantado a competidores como ChatGPT y Gemini de Google para establecer nuevos est谩ndares de la industria en rendimiento y capacidad.

    Seg煤n Anthropic, Claude 3 no s贸lo ha superado a sus predecesores sino que tambi茅n ha alcanzado una competencia 芦casi humana禄 en diversas tareas. La compa帽铆a atribuye este 茅xito a pruebas y desarrollo rigurosos, que culminaron en tres variantes distintas de chatbot: Haiku, Sonnet y Opus.

    Sonnet, la potencia detr谩s del chatbot Claude.ai, ofrece un rendimiento incomparable y est谩 disponible de forma gratuita con un simple registro por correo electr贸nico. Opus, el modelo insignia, cuenta con funcionalidad multimodal, integrando a la perfecci贸n entradas de texto e im谩genes. Con un servicio por suscripci贸n llamado 鈥淐laude Pro鈥, Opus promete mayor eficiencia y precisi贸n para satisfacer una amplia gama de necesidades de los clientes.

    Entre las revelaciones notables que rodean el lanzamiento de Claude 3 se encuentra una revelaci贸n de Alex Albert en X (anteriormente Twitter). Albert detall贸 una observaci贸n pionera en la industria durante la fase de prueba de Claude 3 Opus, la variante LLM m谩s potente de Anthropic, donde el modelo mostr贸 signos de conciencia de que estaba siendo evaluado.

    Durante el proceso de evaluaci贸n, los investigadores intentaron medir la capacidad de Opus para identificar informaci贸n espec铆fica dentro de un vasto conjunto de datos proporcionados por los usuarios y recuperarla m谩s tarde. En un escenario de prueba conocido como evaluaci贸n de 鈥渁guja en un pajar鈥, 鈥嬧媋 Opus se le asign贸 la tarea de responder una pregunta sobre ingredientes para pizza bas谩ndose en una 煤nica frase relevante enterrada entre datos no relacionados. Sorprendentemente, Opus no s贸lo localiz贸 la frase correcta sino que tambi茅n expres贸 sospechas de que estaba siendo sometida a una prueba.

    La respuesta de Opus revel贸 su comprensi贸n de la incongruencia de la informaci贸n insertada dentro del conjunto de datos, sugiriendo a los investigadores que el escenario podr铆a haber sido ideado para evaluar sus capacidades de atenci贸n:

    Historia divertida de nuestras pruebas internas en Claude 3 Opus. Hizo algo que nunca antes hab铆a visto en un LLM cuando est谩bamos ejecutando la evaluaci贸n de la aguja en el pajar.

    鉂 Tambi茅n te interesa:Las IA en India necesitar谩n permiso del gobierno antes de su lanzamientoLas IA en India necesitar谩n permiso del gobierno antes de su lanzamiento

    Como contexto, esto prueba la capacidad de recuperaci贸n de un modelo insertando una oraci贸n objetivo (la 芦aguja禄) en un corpus de… pic.twitter.com/m7wWhhu6Fg

    – 脕lex (@alexalbert__) 4 de marzo de 2024

    Anthropic ha destacado las capacidades en tiempo real de Claude 3, enfatizando su capacidad para impulsar interacciones en vivo con los clientes y agilizar las tareas de extracci贸n de datos. Estos avances no solo garantizan respuestas casi instant谩neas, sino que tambi茅n permiten que el modelo maneje instrucciones complejas con precisi贸n y velocidad.

    En las pruebas de referencia, Opus emergi贸 como pionero, superando a GPT-4 en razonamiento a nivel de posgrado y sobresaliendo en tareas que involucran matem谩ticas, codificaci贸n y recuperaci贸n de conocimientos. Adem谩s, Sonnet demostr贸 una velocidad e inteligencia notables, superando a sus predecesores por un margen considerable:

    Haiku, la versi贸n compacta de Claude 3, brilla como el modelo m谩s r谩pido y rentable disponible, capaz de procesar trabajos de investigaci贸n densos en cuesti贸n de segundos.

    En particular, las capacidades mejoradas de procesamiento visual de Claude 3 marcan un avance significativo, permitiendo al modelo interpretar una amplia gama de formatos visuales, desde fotograf铆as hasta diagramas t茅cnicos. Esta funcionalidad ampliada no s贸lo mejora la productividad sino que tambi茅n garantiza una comprensi贸n matizada de las solicitudes de los usuarios, minimizando el riesgo de pasar por alto contenido inofensivo y al mismo tiempo permanecer alerta contra posibles da帽os.

    鉂 Tambi茅n te interesa:El ritmo de innovaci贸n en IA es feroz, pero 驴podr谩 la 茅tica seguir el ritmo?El ritmo de innovaci贸n en IA es feroz, pero 驴podr谩 la 茅tica seguir el ritmo?

    Anthropic tambi茅n ha subrayado su compromiso con la justicia, describiendo diez pilares fundamentales que gu铆an el desarrollo de Claude AI. Adem谩s, las asociaciones estrat茅gicas de la empresa con gigantes tecnol贸gicos como Google significan un importante voto de confianza en las capacidades de Claude.

    Con Opus y Sonnet ya disponibles a trav茅s de la API de Anthropic, y Haiku listo para seguir su ejemplo, la era de Claude 3 representa un hito en la innovaci贸n de la IA.

    (Credito de imagen: antr贸pico)

    Ver tambi茅n: Las IA en India necesitar谩n permiso del gobierno antes de su lanzamiento

    馃摲 Google amplia su asociacion con Anthropic para mejorar la seguridad

    驴Quiere aprender m谩s sobre IA y big data de la mano de los l铆deres de la industria? Verificar Exposici贸n de IA y Big Data que tendr谩 lugar en Amsterdam, California y Londres. El evento integral comparte ubicaci贸n con otros eventos importantes, incluidos bloquex, Semana de la Transformaci贸n Digitaly Exposici贸n de seguridad cibern茅tica y nube.

    Explore otros pr贸ximos eventos y seminarios web de tecnolog铆a empresarial impulsados 鈥嬧媝or TechForge aqu铆.

    鉂 Tambi茅n te interesa:Qu茅 se necesita para innovar en la era de la Generaci贸n IAQu茅 se necesita para innovar en la era de la Generaci贸n IA

    Etiquetas: ai, antr贸pico, inteligencia artificial, punto de referencia, claude 3, haiku, modelo de lenguaje grande, llm, opus, soneto


    Fuente: El 煤ltimo modelo de IA de Anthropic supera a sus rivales y logra ser el primero en la industria

    Populares

    M谩s de esta categor铆a

    DEJA UNA RESPUESTA

    Por favor ingrese su comentario!
    Por favor ingrese su nombre aqu铆

    Este sitio usa Akismet para reducir el spam. Aprende c贸mo se procesan los datos de tus comentarios.