Servicios web de Amazon (AWS) y Nvidia han anunciado una expansión significativa de su colaboración estratégica en AWS re:Invent. La colaboración tiene como objetivo proporcionar a los clientes infraestructura, software y servicios de última generación para impulsar innovaciones generativas de IA.
La colaboración reúne las fortalezas de ambas empresas, integrando los últimos sistemas multinodo de NVIDIA con GPU, CPU y software de inteligencia artificial de próxima generación, junto con tecnologías de AWS como la virtualización avanzada Nitro System, la interconexión Elastic Fabric Adapter (EFA) y UltraCluster. escalabilidad.
Los aspectos más destacados de la colaboración ampliada incluyen:
- AWS se convierte en el primer proveedor de nube en ofrecer Superchips NVIDIA GH200 Grace Hopper con la nueva tecnología NVLink multinodo.
- La plataforma multinodo NVIDIA GH200 NVL32 permite a los clientes conjuntos escalar a miles de Superchips GH200, proporcionando un rendimiento de clase supercomputadora.
- Colaboración para alojar NVIDIA DGX Cloud, un servicio de capacitación de IA, en AWS, que incluye GH200 NVL32 para una capacitación acelerada de IA generativa y modelos de lenguaje grandes.
- Colaboración en el Proyecto Ceiba, cuyo objetivo es diseñar la supercomputadora de IA impulsada por GPU más rápida del mundo con 16,384 Superchips NVIDIA GH200 y una capacidad de procesamiento de 65 exaflops.
- AWS presenta tres nuevas instancias Amazon EC2, incluidas instancias P5e con tecnología de GPU NVIDIA H200 Tensor Core para cargas de trabajo de IA generativa y HPC a gran escala.
- NVIDIA presenta software en AWS, como el microservicio NeMo Retriever para chatbots y herramientas de resumen, y BioNeMo para acelerar el descubrimiento de fármacos para las empresas farmacéuticas.
Esta colaboración significa un compromiso conjunto para avanzar en el campo de la IA generativa, ofreciendo a los clientes acceso a tecnologías y recursos de vanguardia.
Internamente, los equipos de robótica y cumplimiento de Amazon ya emplean la plataforma Omniverse de NVIDIA para optimizar los almacenes en entornos virtuales antes de la implementación en el mundo real.
La integración de las tecnologías NVIDIA y AWS acelerará el desarrollo, la capacitación y la inferencia de grandes modelos de lenguaje y aplicaciones de IA generativa en diversas industrias.
(Foto por ANIRUDH en desempaquetar)
Ver también: Inflection-2 supera al PaLM 2 de Google en puntos de referencia comunes
¿Quiere aprender más sobre IA y big data de la mano de los líderes de la industria? Verificar Exposición de IA y Big Data que tendrá lugar en Ámsterdam, California y Londres. El evento integral comparte ubicación con Exposición de seguridad cibernética y nube y Semana de la Transformación Digital.
Explore otros próximos eventos y seminarios web de tecnología empresarial impulsados por TechForge aquí.
Fuente: AWS y NVIDIA amplían su asociación para avanzar en la IA generativa