M谩s

    NVIDIA presenta los 煤ltimos avances en IA visual

    - Advertisement -

    Los investigadores de NVIDIA presentan nuevos modelos y t茅cnicas de IA visual generativa en el Visi贸n por computadora y reconocimiento de patrones (CVPR) esta semana en Seattle. Los avances abarcan 谩reas como generaci贸n de im谩genes personalizadas, edici贸n de escenas 3D, comprensi贸n del lenguaje visual y percepci贸n de veh铆culos aut贸nomos.

    芦La inteligencia artificial, y la IA generativa en particular, representa un avance tecnol贸gico fundamental禄, dijo Jan Kautz, vicepresidente de investigaci贸n de aprendizaje y percepci贸n de NVIDIA.

    芦En CVPR, NVIDIA Research comparte c贸mo estamos superando los l铆mites de lo que es posible: desde potentes modelos de generaci贸n de im谩genes que podr铆an potenciar a los creadores profesionales hasta software de conducci贸n aut贸noma que podr铆a ayudar a habilitar veh铆culos aut贸nomos de pr贸xima generaci贸n禄.

    Entre los m谩s de 50 proyectos de investigaci贸n de NVIDIA presentados, dos art铆culos han sido seleccionados como finalistas para los premios CVPR Best Paper Awards: uno explora el din谩mica de entrenamiento de modelos de difusi贸n y otro en mapas de alta definici贸n para veh铆culos aut贸nomos.

    Adem谩s, NVIDIA gan贸 la pista de conducci贸n a escala de extremo a extremo del CVPR Automobiles Grand Challenge, superando a m谩s de 450 participantes en todo el mundo. Este hito demuestra el trabajo pionero de NVIDIA en el uso de IA generativa para modelos integrales de veh铆culos aut贸nomos, y tambi茅n obtuvo un Premio a la Innovaci贸n de CVPR.

    鉂 Tambi茅n te interesa:Generador de mensajes ChatGPT: liberar el poder de las conversaciones de IAGenerador de mensajes ChatGPT: liberar el poder de las conversaciones de IA

    Uno de los principales proyectos de investigaci贸n es jediuna nueva t茅cnica que permite a los creadores personalizar r谩pidamente los modelos de difusi贸n (el enfoque l铆der para la generaci贸n de texto a imagen) para representar objetos o personajes espec铆ficos utilizando solo unas pocas im谩genes de referencia, en lugar del proceso de ajuste fino que requiere mucho tiempo. conjuntos de datos.

    Otro avance es Fundaci贸nPose, un nuevo modelo b谩sico que puede comprender y rastrear instant谩neamente la pose 3D de los objetos en videos sin entrenamiento por objeto. Estableci贸 un nuevo r茅cord de rendimiento y podr铆a desbloquear nuevas aplicaciones de rob贸tica y AR.

    Los investigadores de NVIDIA tambi茅n presentaron NeRFDeformer, un m茅todo para editar la escena 3D capturada por un campo de radiaci贸n neuronal (NeRF) utilizando una 煤nica instant谩nea 2D, en lugar de tener que reanimar manualmente los cambios o recrear el NeRF por completo. Esto podr铆a agilizar la edici贸n de escenas 3D para aplicaciones de gr谩ficos, rob贸tica y gemelos digitales.

    En el frente del lenguaje visual, NVIDIA colabor贸 鈥嬧媍on el MIT para desarrollar VILA, una nueva familia de modelos de lenguaje visual que logran un rendimiento de vanguardia en la comprensi贸n de im谩genes, videos y texto. Con capacidades de razonamiento mejoradas, VILA puede incluso comprender memes de Internet combinando comprensi贸n visual y ling眉铆stica.

    La investigaci贸n de IA visual de NVIDIA abarca numerosas industrias, incluidos m谩s de una docena de art铆culos que exploran enfoques novedosos para la percepci贸n, el mapeo y la planificaci贸n de veh铆culos aut贸nomos. Sanja Fidler, vicepresidenta del equipo de investigaci贸n de IA de NVIDIA, presenta el potencial de los modelos de lenguaje visual para veh铆culos aut贸nomos.

    La amplitud de la investigaci贸n CVPR de NVIDIA ejemplifica c贸mo la IA generativa podr铆a empoderar a los creadores, acelerar la automatizaci贸n en la fabricaci贸n y la atenci贸n m茅dica, al tiempo que impulsa la autonom铆a y la rob贸tica.

    (Foto por v2osk)

    鉂 Tambi茅n te interesa:Meta presenta cinco modelos de IA para procesamiento multimodal, generaci贸n de m煤sica y m谩sMeta presenta cinco modelos de IA para procesamiento multimodal, generaci贸n de m煤sica y m谩s

    Ver tambi茅n: NLEP: cerrando la brecha entre los LLM y el razonamiento simb贸lico

    驴Quiere aprender m谩s sobre IA y big data de la mano de los l铆deres de la industria? Verificar Exposici贸n de IA y Big Data que tendr谩 lugar en Amsterdam, California y Londres. El evento integral comparte ubicaci贸n con otros eventos importantes, incluidos Conferencia de automatizaci贸n inteligente, bloquex, Semana de la Transformaci贸n Digitaly Exposici贸n de seguridad cibern茅tica y nube.

    Explore otros pr贸ximos eventos y seminarios web de tecnolog铆a empresarial impulsados 鈥嬧媝or TechForge aqu铆.

    Etiquetas: IA, inteligencia artificial, visi贸n por computadora, CVPR, FoundationPose, IA generativa, jedi, Nvidia, VILA

    Fuente: NVIDIA presenta los 煤ltimos avances en IA visual

    鉂 Tambi茅n te interesa:La nueva startup del cofundador de OpenAI, Ilya Sutskever, apunta a una ‘superinteligencia segura’La nueva startup del cofundador de OpenAI, Ilya Sutskever, apunta a una ‘superinteligencia segura’

    Populares

    M谩s de esta categor铆a

    DEJA UNA RESPUESTA

    Por favor ingrese su comentario!
    Por favor ingrese su nombre aqu铆

    Este sitio usa Akismet para reducir el spam. Aprende c贸mo se procesan los datos de tus comentarios.