Reddit ha negociado un acuerdo de licencia de contenido para permitir que sus datos se utilicen para entrenar modelos de IA, según un Bloomberg informe.
Justo antes de un posible debut de oferta pública inicial (IPO) de 5 mil millones de dólares en marzo, Reddit habría firmado un acuerdo de 60 millones de dólares con una importante empresa de inteligencia artificial no revelada. Esta medida podría verse como un esfuerzo de último minuto para mostrar a posibles inversores posibles fuentes de ingresos en la industria de la IA en rápido crecimiento.
Aunque Reddit aún tiene que confirmar el acuerdo, la decisión podría tener implicaciones importantes. De ser cierto, significaría que el vasto tesoro de contenido generado por los usuarios de Reddit (incluidas publicaciones de subreddits populares, comentarios de usuarios destacados y desconocidos y debates sobre una amplia gama de temas) podría usarse para entrenar y mejorar los grandes modelos de lenguaje existentes. (LLM) o proporcionar la base para el desarrollo de nuevos sistemas de IA generativa.
Sin embargo, es posible que esta decisión de Reddit no le sienta bien a su base de usuarios, ya que la empresa se ha enfrentado a una creciente oposición de su comunidad con respecto a sus recientes decisiones comerciales.
El año pasado, cuando Reddit anunció planes para comenzar a cobrar por el acceso a sus interfaces de programación de aplicaciones (API), miles de foros de Reddit cerraron temporalmente. en protesta. Días después, un grupo de hackers de Reddit amenazado revelar datos del sitio previamente robados a menos que la empresa revoque el plan API o pague un rescate de 4,5 millones de dólares.
Reddit ha tomado recientemente otras decisiones controvertidas, como eliminar años de registros de chat privados y mensajes de las cuentas de los usuarios. La plataforma también implementó nuevas funciones de moderación automática y eliminó la opción para que los usuarios desactivaran la publicidad personalizada, lo que generó un descontento adicional entre sus usuarios.
Este último acuerdo informado para vender los datos de Reddit para el entrenamiento de IA podría generar aún más reacciones negativas por parte de los usuarios, a medida que el debate sobre la ética del uso de datos públicos, arte y otros contenidos creados por humanos para entrenar sistemas de IA continúa intensificándose en diversas industrias y plataformas. .
(Foto por Brett Jordán en desempaquetar)
Ver también: Amazon entrena LLM de parámetros 980M con ‘habilidades emergentes’
¿Quiere aprender más sobre IA y big data de la mano de los líderes de la industria? Verificar Exposición de IA y Big Data que tendrá lugar en Amsterdam, California y Londres. El evento integral comparte ubicación con otros eventos importantes, incluidos bloquex, Semana de la Transformación Digitaly Exposición de seguridad cibernética y nube.
Explore otros próximos eventos y seminarios web de tecnología empresarial impulsados por TechForge aquí.
Fuente: Reddit supuestamente vende datos para entrenamiento de IA