Abierto AI ha anunciado la capacidad de ajustar sus potentes modelos de lenguaje, incluidos GPT-3.5 Turbo y GPT-4.
El ajuste permite a los desarrolladores adaptar los modelos a sus casos de uso específicos e implementar estos modelos personalizados a escala. Este movimiento tiene como objetivo cerrar la brecha entre las capacidades de IA y las aplicaciones del mundo real, presagiando una nueva era de interacciones de IA altamente especializadas.
Con las primeras pruebas que arrojaron resultados impresionantes, una versión mejorada del GPT-3.5 Turbo ha demostrado la capacidad no solo de igualar sino incluso superar las capacidades del GPT-4 básico para ciertas tareas limitadas.
Todos los datos enviados dentro y fuera de la API de ajuste siguen siendo propiedad del cliente, lo que garantiza que la información confidencial permanezca segura y no se utilice para entrenar otros modelos.
El despliegue de ajustes ha despertado un gran interés por parte de desarrolladores y empresas. Desde la introducción de GPT-3.5 Turbo, la demanda de personalizar modelos para crear experiencias de usuario únicas ha ido en aumento.
El ajuste fino abre un mundo de posibilidades en varios casos de uso, que incluyen:
- Manejabilidad mejorada: Los desarrolladores ahora pueden ajustar los modelos para seguir las instrucciones con mayor precisión. Por ejemplo, una empresa que desee respuestas consistentes en un idioma en particular puede asegurarse de que el modelo siempre responda en ese idioma.
- Formateo de salida confiable: El formato coherente de las respuestas generadas por IA es crucial, especialmente para aplicaciones como la finalización de código o la redacción de llamadas API. El ajuste mejora la capacidad del modelo para generar respuestas con el formato adecuado, mejorando la experiencia del usuario.
- Tono personalizado: El ajuste permite a las empresas refinar el tono de la salida del modelo para alinearlo con la voz de su marca. Esto garantiza un estilo de comunicación coherente y acorde con la marca.
Una ventaja importante del GPT-3.5 Turbo optimizado es su capacidad ampliada de manejo de tokens. Con la capacidad de manejar tokens de 4k (el doble de capacidad que los modelos optimizados anteriores), los desarrolladores pueden optimizar el tamaño de sus solicitudes, lo que genera llamadas API más rápidas y ahorros de costos.
Para lograr resultados óptimos, el ajuste fino se puede combinar con técnicas como ingeniería rápida, recuperación de información y llamada de funciones. OpenAI también planea introducir soporte para ajustes con llamadas a funciones y gpt-3.5-turbo-16k en los próximos meses.
El proceso de ajuste implica varios pasos, incluida la preparación de datos, la carga de archivos, la creación de un trabajo de ajuste y el uso del modelo ajustado en producción. OpenAI está trabajando en una interfaz de usuario para simplificar la gestión de tareas de ajuste.
La estructura de precios para el ajuste comprende dos componentes: el costo de capacitación inicial y los costos de uso.
- Entrenamiento: $0.008 / 1K Tokens
- Entrada de uso: $0.012 / 1K Tokens
- Salida de uso: $0.016 / 1K Tokens
La introducción de modelos GPT-3 actualizados – babbage-002 y davinci-002 – también se ha anunciado, proporcionando reemplazos para los modelos existentes y permitiendo ajustes para una mayor personalización.
Estos últimos anuncios subrayan la dedicación de OpenAI a la creación de soluciones de IA que puedan adaptarse para satisfacer las necesidades únicas de empresas y desarrolladores.
(Credito de imagen: claudia de Pixabay)
Ver también: El sesgo político de ChatGPT resaltado en un estudio
¿Quiere aprender más sobre IA y big data de la mano de los líderes de la industria? Verificar Exposición de IA y Big Data que tendrá lugar en Amsterdam, California y Londres. El evento integral comparte ubicación con Semana de la Transformación Digital.
Explore otros próximos eventos y seminarios web de tecnología empresarial impulsados por TechForge aquí.
Fuente: OpenAI presenta ajustes para GPT-3.5 Turbo y GPT-4