Apple leans on synthetic data to upgrade AI privately

Apple se apoya en los datos sintéticos para actualizar la IA en privado

Apple está adoptando un nuevo enfoque para capacitar a sus modelos de IA, uno que evita recopilar o copiar contenido de usuario de iPhones o Mac.

Según un reciente blogla Compañía planea continuar basando en datos sintéticos (datos construidos que se utilizan para imitar el comportamiento del usuario) y la privacidad diferencial para mejorar las características como los resúmenes del correo electrónico, sin obtener acceso a correos electrónicos o mensajes personales.

Para los usuarios que optan por el programa de análisis de dispositivos de Apple, los modelos de IA de la compañía compararán mensajes de correo electrónico sintéticos con una pequeña muestra del contenido de un usuario real almacenado localmente en el dispositivo. Luego, el dispositivo identifica cuál de los mensajes sintéticos coincide más con su muestra de usuario, y envía información sobre la coincidencia seleccionada a Apple. No hay datos reales del usuario del dispositivo, y Apple dice que recibe solo información agregada.

La técnica permitirá a Apple mejorar sus modelos para tareas de generación de texto de forma más larga sin recopilar contenido real del usuario. Es una extensión del uso de privacidad diferencial de larga data de la compañía, que introduce datos aleatorios en conjuntos de datos más amplios para ayudar a proteger las identidades individuales. Apple ha utilizado este método desde 2016 para comprender los patrones de uso, en línea con las políticas de protección de la compañía.

Mejora de Genmoji y otras características de inteligencia de Apple

La compañía ya utiliza la privacidad diferencial para mejorar las características como Genmoji, donde recopila tendencias generales sobre qué indicaciones son más populares sin vincular ningún indicador con un usuario o dispositivo específico. En los próximos lanzamientos, Apple planea aplicar métodos similares a otras características de inteligencia de Apple, que incluyen imágenes de juegos, varita de imagen, creación de recuerdos y herramientas de escritura.

Para Genmoji, la compañía encuesta anónimamente dispositivos participantes para determinar si se han visto fragmentos de inmediato específicos. Cada dispositivo responde con una señal ruidosa: algunas respuestas reflejan el uso real, mientras que otras son aleatorizadas. El enfoque asegura que solo los términos ampliamente utilizados se vuelvan visibles para Apple, y no se puede remontar ninguna respuesta individual a un usuario o dispositivo, dice la compañía.

Curación de datos sintéticos para mejores resúmenes de correo electrónico

Si bien el método anterior ha funcionado bien con respecto a las breves indicaciones, Apple necesitaba un nuevo enfoque para tareas más complejas como resumir los correos electrónicos. Para esto, Apple genera miles de mensajes de muestra, y estos mensajes sintéticos se convierten en representaciones numéricas, o ‘incrustaciones’, basadas en el lenguaje, el tono y el tema. Los dispositivos de usuario participantes comparan los incrustaciones con muestras almacenadas localmente. Nuevamente, solo se comparte la coincidencia seleccionada, no el contenido en sí.

Apple recopila los incrustaciones sintéticas seleccionadas más frecuentemente de los dispositivos participantes y los utiliza para refinar sus datos de capacitación. Con el tiempo, este proceso permite que el sistema genere correos electrónicos sintéticos más relevantes y realistas, ayudando a Apple a mejorar sus salidas de IA para resumir y generación de texto sin un compromiso aparente de la privacidad del usuario.

Disponible en beta

Apple está implementando el sistema en versiones beta de iOS 18.5, iPados 18.5 y macOS 15.5. Según Mark Gurman de Bloomberg, Apple está intentando abordar los desafíos con su desarrollo de IA de esta manera, problemas que han incluido despliegues de características retrasadas y las consecuencias de los cambios de liderazgo en el equipo Siri.

Queda por ver si su enfoque producirá más resultados útiles en la práctica, pero señala un claro esfuerzo público para equilibrar la privacidad del usuario con el rendimiento del modelo.

(Foto por Sin estelares)

Ver también: ChatGPT obtuvo otro momento viral con la tendencia de ‘AI Action Figura’

¿Quiere obtener más información sobre AI y Big Data de los líderes de la industria? Verificar AI y Big Data Expo que tiene lugar en Amsterdam, California y Londres. El evento integral está ubicado en otros eventos líderes, incluidos Conferencia de automatización inteligente, Bloqueo, Semana de transformación digitaly Cyber ​​Security & Cloud Expo.

Explore otros próximos eventos y seminarios web tecnológicos empresariales con TechForge aquí.

Fuente: Apple se apoya en los datos sintéticos para actualizar la IA en privado

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

This site uses Akismet to reduce spam. Learn how your comment data is processed.