Más

    El primer modelo de inteligencia artificial multimodal en tiempo real de China

    - Advertisement -

    Sentido del tiempo presentó SenseNova 5.5, una versión mejorada de su LLM que incluye SenseNova 5o, promocionado como el primer modelo multimodal en tiempo real de China.

    SenseNova 5o representa un gran avance en la interacción con IA, ya que ofrece capacidades equivalentes a las de las funciones de interacción en streaming de GPT-4o. Este avance permite a los usuarios interactuar con el modelo de una manera similar a la de conversar con una persona real, lo que lo hace especialmente adecuado para aplicaciones de reconocimiento de voz y conversación en tiempo real.

    Según SenseTime, su último modelo supera a sus rivales en varios puntos de referencia:

    En la Conferencia Mundial de Inteligencia Artificial (WAIC) en Shanghái este fin de semana, SenseTime presentó SenseNova 5.5.

    La empresa afirma que el modelo supera a GPT-4o en 5 de 8 métricas clave.

    Aunque lo tomaría con pinzas, las empresas emergentes de inteligencia artificial de China están mostrando un progreso importante. imagen.twitter.com/1ZFbojHs3v

    —Rowan Cheung (@rowancheung) 8 de julio de 2024

    El Dr. Xu Li, presidente del directorio y director ejecutivo de SenseTime, comentó: «Este es un año crítico para los modelos de gran tamaño, ya que evolucionan de unimodales a multimodales. En línea con las necesidades de los usuarios, SenseTime también se centra en impulsar la interactividad.

    “Con aplicaciones que impulsan el desarrollo de modelos y sus capacidades, junto con avances tecnológicos en interacciones de transmisión multimodal, seremos testigos de transformaciones sin precedentes en las interacciones entre humanos e IA”.

    La versión mejorada de SenseNova 5.5 ofrece un rendimiento general mejorado en un 30 % en comparación con su predecesora, SenseNova 5.0, que se lanzó apenas dos meses antes. Entre las mejoras más notables se incluyen un mejor razonamiento matemático, dominio del inglés y capacidad para seguir órdenes.

    En un intento por democratizar el acceso a las capacidades avanzadas de IA, SenseTime ha presentado un modelo de gran tamaño y rentable para el borde de la red. Este desarrollo reduce el costo por dispositivo a tan solo 9,90 RMB (1,36 dólares) por año, lo que podría acelerar la adopción generalizada en varios dispositivos de IoT.

    La empresa también ha lanzado el “Proyecto $0 Go”, un paquete de incorporación gratuito para usuarios empresariales que migran desde la plataforma OpenAI. Esta iniciativa incluye un paquete de 50 millones de tokens y servicios de consultoría de migración de API, cuyo objetivo es reducir las barreras de entrada para las empresas que buscan aprovechar las capacidades de SenseNova.

    El compromiso de SenseTime con la inteligencia artificial en el borde de la red se evidencia en el lanzamiento de SenseChat Lite-5.5, que presenta una reducción del 40 % en el tiempo de inferencia en comparación con su predecesor, ahora en solo 0,19 segundos. La velocidad de inferencia también ha aumentado en un 15 %, alcanzando las 90,2 palabras por segundo.

    Para ampliar su gama de aplicaciones de inteligencia artificial, SenseTime presentó Vimi, un generador de videos de avatares con inteligencia artificial controlable. Esta herramienta puede crear videoclips cortos con un control preciso de las expresiones faciales y los movimientos de la parte superior del cuerpo a partir de una sola foto, lo que abre nuevas posibilidades en el entretenimiento y las aplicaciones interactivas.

    La empresa también ha actualizado su serie SenseTime Raccoon, un conjunto de herramientas de productividad nativas de IA. Code Raccoon ahora cuenta con una mejora de cinco veces en la velocidad de respuesta y un aumento del 10% en la precisión de codificación, mientras que Office Raccoon se ha ampliado para incluir una página web orientada al consumidor y una versión de miniaplicación de WeChat.

    La tecnología de modelos a gran escala de SenseTime ya está generando revuelo en diversas industrias. En el sector financiero, está mejorando la eficiencia en el cumplimiento normativo, el marketing y la investigación de inversiones. En la agricultura, está ayudando a reducir el uso de materiales en un 20% y a aumentar el rendimiento de los cultivos en un 15%. La industria del turismo cultural está experimentando un aumento significativo en la planificación de viajes y la eficiencia de las reservas.

    Con más de 3000 clientes gubernamentales y corporativos que ya utilizan SenseNova en los sectores de tecnología, atención médica, finanzas y programación, SenseTime está consolidando su posición como un actor clave en IA.

    (Credito de imagen: Sentido del tiempo)

    Ver también: La revolución de la inteligencia artificial en la educación estadounidense: cómo las aplicaciones chinas están marcando el camino

    ¿Quieres aprender más sobre IA y big data de los líderes de la industria? Verificar Exposición de IA y Big Data El evento, que se llevará a cabo en Ámsterdam (California) y Londres, se llevará a cabo junto con otros eventos importantes, entre ellos Conferencia sobre automatización inteligente, Bloque X, Semana de la Transformación Digitaly Exposición de ciberseguridad y la nube.

    Explore otros próximos eventos y seminarios web sobre tecnología empresarial impulsados ​​por TechForge aquí.

    Etiquetas: ai, inteligencia artificial, benchmark, China, modelo, multimodal, sensenova, sensetime


    Fuente: El primer modelo de inteligencia artificial multimodal en tiempo real de China

    Populares

    Más de esta categoría

    DEJA UNA RESPUESTA

    Por favor ingrese su comentario!
    Por favor ingrese su nombre aquí

    This site uses Akismet to reduce spam. Learn how your comment data is processed.