Intermediario ha anunciado el lanzamiento alfa de su modelo de generación de imágenes V7 para las pruebas de la comunidad de IA. El nuevo modelo incluye mejoras en la comprensión del texto, la calidad de la imagen y la coherencia de las funciones.
«V7 es un modelo sorprendente. Es mucho más inteligente con las indicaciones de texto, las indicaciones de la imagen se ven fantásticas, la calidad de imagen es notablemente más alta con hermosas texturas y cuerpos, manos y objetos de todo tipo tienen una coherencia significativamente mejor en todos los detalles», explicó MidJourney.
Una innovación clave en V7 es la activación predeterminada de la personalización del modelo. Los usuarios deben desbloquear inicialmente esta función, un proceso que lleva aproximadamente cinco minutos. Esta personalización se puede activar o desactivar en cualquier momento y está destinada a mejorar significativamente la capacidad de la IA para interpretar los deseos del usuario y las preferencias estéticas. MidJourney cree que esta función establece un nuevo punto de referencia para comprender la intención del usuario.
MidJourney también está presentando una característica junto con el modelo de generación de imágenes V7 llamado ‘modo de borrador’, que promete generar imágenes diez veces más rápido y a la mitad del costo.
Este aumento de la velocidad ha permitido a MidJourney implementar un «modo de conversación» único en su interfaz web. Los usuarios ahora pueden instruir al sistema para que realice cambios, como reemplazar a un gato con un búho o alterar la hora del día a la noche, y la IA ajustará automáticamente el aviso e iniciará una nueva tarea de generación de imágenes.
El modo de borrador también incorpora la funcionalidad de entrada de voz. Al presionar el botón Micrófono, los usuarios pueden articular verbalmente sus ideas y observar las imágenes a medida que se generan en tiempo real:
MidJourney cree que Draft Mode ofrece un método sin precedentes para refinar conceptos creativos. Si una imagen generada es atractiva, los usuarios pueden seleccionar las opciones ‘Mejorar’ o ‘variar’ para volver a renderizarla en plena calidad. Si bien las imágenes de borrador son de menor calidad en comparación con el modo estándar, su comportamiento y las características estéticas siguen siendo consistentes.
El modelo de generación de imágenes V7 de MidJourney estará inicialmente disponible en dos modos de velocidad: turbo y relajarse. El modo de velocidad estándar está actualmente en optimización adicional y se espera que se lance en breve. MidJourney ha aclarado que los trabajos turbo costarán el doble que un trabajo estándar, mientras que los trabajos de draft costarán la mitad de la cantidad.
La compañía también proporcionó actualizaciones sobre otras funcionalidades. Las características como el aumento de la escala, la edición y la retirada se volverán inicialmente a usar el modelo V6, con actualizaciones planificadas para el futuro. La funcionalidad para las tablas de humor y SREF actualmente está operativa y se espera que el rendimiento mejore con las actualizaciones posteriores.
Mirando hacia el futuro cercano, MidJourney ha esbozado un programa de desarrollo activo. Los usuarios pueden esperar nuevas características cada una o dos semanas durante los próximos 60 días. Una característica importante significativa será una nueva capacidad de referencia de carácter y objeto V7.
Finalmente, MidJourney ha aconsejado a los usuarios que V7 es un modelo completamente nuevo con sus propias fortalezas y debilidades potenciales únicas. Fomentan la experimentación y la retroalimentación sobre sus capacidades, recordando a los usuarios que puede requerir diferentes técnicas de solicitud en comparación con las versiones anteriores.
(Crédito de la imagen: Midjourney)
Ver también: Instituto Tony Blair AI Informe de derechos de autor Sparks Racklash
¿Quiere obtener más información sobre AI y Big Data de los líderes de la industria? Verificar AI y Big Data Expo que tiene lugar en Amsterdam, California y Londres. El evento integral está ubicado en otros eventos líderes, incluidos Conferencia de automatización inteligente, Bloqueo, Semana de transformación digitaly Cyber Security & Cloud Expo.
Explore otros próximos eventos y seminarios web tecnológicos empresariales con TechForge aquí.