Reddit está presionando para lograr una asociación mejorada con Google, con el objetivo de asegurar más usuarios y mayores ingresos a cambio de brindar un acceso aún mayor a sus valiosos datos para el entrenamiento en IA. Este desarrollo, informado por Bloomberg, resalta las tensiones actuales entre las plataformas de contenido y los gigantes tecnológicos en la era de la inteligencia artificial, donde los acuerdos de licencia de datos deben equilibrar la monetización con la preservación del tráfico y la participación del sitio.
Hace aproximadamente 18 meses, Reddit firmó su acuerdo inicial de intercambio de datos con Google, valorado en alrededor de 60 millones de dólares anuales. Ahora, la plataforma de redes sociales está volviendo a las negociaciones, buscando una posición más destacada dentro de la infraestructura de inteligencia artificial de Google. Según ejecutivos anónimos citados por Bloomberg, Reddit quiere que Google implemente mecanismos que dirijan a los usuarios (que a menudo obtienen respuestas derivadas del contenido de Reddit a través de herramientas de inteligencia artificial) de regreso a la plataforma. El objetivo es alentar a estos usuarios a publicar contenido nuevo, generando así datos nuevos para impulsar los modelos de inteligencia artificial y al mismo tiempo impulsar la actividad de la comunidad de Reddit.
Además de la redirección de usuarios, Reddit aboga por una mayor compensación por sus datos. La compañía está explorando un modelo de precios dinámico para futuros acuerdos de licencia, no solo con Google sino también con entidades como OpenAI. Según este sistema propuesto, los pagos variarían según la utilidad y relevancia del contenido para las respuestas generadas por la IA, lo que garantizaría una valoración más justa de las contribuciones de Reddit.
Los ejecutivos argumentan que los términos del acuerdo existente subestiman el conjunto de datos de Reddit, que destaca por su autenticidad y estructura en un panorama en línea a menudo criticado por contenido “basura” de baja calidad. Las publicaciones de Reddit presentan discusiones genuinas y sinceras de usuarios reales, organizadas temáticamente en foros y clasificadas a través de un sistema de votación impulsado por la comunidad en lugar de algoritmos opacos. Esta cualidad seleccionada por humanos lo hace excepcionalmente atractivo para los desarrolladores de IA que buscan datos de entrenamiento confiables.
Los datos subrayan la prominencia de Reddit en el dominio de la IA: es la fuente citada con más frecuencia para herramientas como Perplexity y AI Overviews de Google. Una estrategia de búsqueda popular entre los usuarios implica agregar “reddit” a las consultas de Google para obtener resultados más precisos y reveladores, lo que evidencia aún más la influencia de la plataforma.
Esta negociación ejemplifica una paradoja más amplia en las licencias de IA: los proveedores de contenido como Reddit proporcionan los datos esenciales para entrenar modelos avanzados, pero esos mismos modelos corren el riesgo de desviar el tráfico de las fuentes originales. Al exigir términos que incluyan estrategias de retención de usuarios junto con ganancias financieras, Reddit pretende mantener la vitalidad de su ecosistema en medio del auge de las herramientas de búsqueda y resumen impulsadas por IA.
Las conversaciones reflejan un mercado maduro para los acuerdos de datos de IA, donde las plataformas son cada vez más asertivas a la hora de proteger su viabilidad a largo plazo. A medida que la IA continúa evolucionando, estos acuerdos podrían sentar precedentes sobre cómo las empresas de tecnología compensan y colaboran con los creadores de contenido.







