Laboratorio de IA con sede en Londres Estabilidad La IA tiene Anunciado una vista previa de su nuevo modelo de texto a imagen, Stable Diffusion 3. El modelo avanzado de IA generativa tiene como objetivo crear imágenes de alta calidad a partir de indicaciones de texto con un rendimiento mejorado en varias áreas clave.
El anuncio se produce pocos días después de que se presentara el mayor rival de Stability AI, OpenAI. sora—Un nuevo modelo de IA capaz de generar vídeos de alta definición casi realistas a partir de simples indicaciones de texto.
Sora, que tampoco está disponible todavía para el público en general, generó preocupaciones sobre su potencial para crear imágenes falsas de apariencia realista. OpenAI dijo que está trabajando con expertos en desinformación y contenido de odio para probar la herramienta antes de que esté ampliamente disponible.
Según Stability AI, Stable Diffusion 3 tiene capacidades significativamente mejores para manejar la generación de imágenes de múltiples sujetos en comparación con versiones anteriores. Esto permite a los usuarios incluir indicaciones más detalladas con múltiples elementos y lograr mejores resultados.
Además de las mejoras con indicaciones complejas, el nuevo modelo cuenta con una calidad de imagen general mejorada y precisión ortográfica. Stability AI afirma que estas actualizaciones resuelven algunos problemas de consistencia y coherencia que han afectado a los modelos anteriores de conversión de texto a imagen.
Si bien aún no está disponible públicamente, Stability AI ha abierto una lista de espera para personas interesadas en el acceso temprano a Stable Diffusion 3. La fase de vista previa permitirá a Stability AI recopilar comentarios y continuar perfeccionando el modelo antes de un lanzamiento completo planificado para finales de este año.
Stability AI dijo que también está trabajando con expertos para probar Stable Diffusion 3 y garantizar que mitigue los daños potenciales, similar al enfoque de OpenAI con Sora.
“Creemos en prácticas de IA seguras y responsables. Esto significa que hemos tomado y seguimos tomando medidas razonables para evitar el uso indebido de Stable Diffusion 3 por parte de malos actores. La seguridad comienza cuando comenzamos a entrenar nuestro modelo y continúa durante las pruebas, la evaluación y la implementación”, dijo Stability AI.
“En preparación para esta vista previa temprana, hemos introducido numerosas salvaguardas. Al colaborar continuamente con investigadores, expertos y nuestra comunidad, esperamos innovar más con integridad a medida que nos acercamos al lanzamiento público del modelo”.
Stable Diffusion 3 se ofrece en una variedad de tamaños de modelos, desde 800 millones de parámetros en la gama baja hasta 8 mil millones en la gama alta. Stability AI dijo que este espectro de opciones tiene como objetivo equilibrar el rendimiento creativo y la accesibilidad para usuarios con diferentes recursos computacionales.
«Nuestro compromiso de garantizar que la IA generativa sea abierta, segura y universalmente accesible sigue siendo firme», explicó Stability AI.
«Con Stable Diffusion 3, nos esforzamos por ofrecer soluciones adaptables que permitan a individuos, desarrolladores y empresas dar rienda suelta a su creatividad, alineándonos con nuestra misión de activar el potencial de la humanidad».
(Credito de imagen: Estabilidad IA)
Ver también: Google se compromete a solucionar la generación de imágenes inexacta y sesgada de Gemini
¿Quiere aprender más sobre IA y big data de la mano de los líderes de la industria? Verificar Exposición de IA y Big Data que tendrá lugar en Amsterdam, California y Londres. El evento integral comparte ubicación con otros eventos importantes, incluidos bloquex, Semana de la Transformación Digitaly Exposición de seguridad cibernética y nube.
Explore otros próximos eventos y seminarios web de tecnología empresarial impulsados por TechForge aquí.
Fuente: Stability AI muestra una vista previa del modelo de texto a imagen de Stable Diffusion 3