Reddit hizo un gran cambio esta semana para proteger su contenido contra la toma sin permiso. Actualizaron algo llamado archivo robots.txt, que indica a los programas informáticos (como los utilizados por los motores de búsqueda) si pueden visitar un sitio web. Este archivo ha sido importante para permitir que los motores de búsqueda le muestren sitios web cuando busca algo.
Pero ahora, con el auge de la inteligencia artificial, algunas empresas están tomando contenido de sitios web como Reddit para entrenar sus sistemas de inteligencia artificial sin preguntar ni dar crédito a los creadores originales. Esto se ha convertido en un gran problema porque no respeta a las personas que crearon el contenido ni a los sitios web que lo alojan.
¿Qué está haciendo Reddit?
La actualización de Reddit del archivo robots.txt tiene como objetivo controlar cómo se utiliza su contenido. También limitarán y bloquearán el acceso a su sitio a programas informáticos y bots desconocidos si no siguen las reglas de Reddit o no tienen permiso para usar el contenido.
Reddit dice que estos cambios no afectarán a la mayoría de las personas ni a las buenas organizaciones como investigadores o grupos que guardan el historial de Internet (como Internet Archive). En cambio, están intentando impedir que las empresas de inteligencia artificial utilicen el contenido de Reddit sin permiso. Sin embargo, estos programas de IA aún podrían ignorar las reglas de Reddit.
Investigaciones recientes y respuestas
El anuncio sigue a un informe de Wired, que descubrió que una empresa de búsqueda basada en inteligencia artificial llamada Perplexity estaba tomando contenido de sitios web, a pesar de que se le había dicho que no lo hiciera en el archivo robots.txt. El director ejecutivo de Perplexity argumentó que estas reglas no son requisitos legales, lo que generó un debate sobre cómo los sitios web pueden proteger su contenido.
Los datos de Reddit pertenecen a Google, de momento
Las nuevas reglas de Reddit no afectarán a las empresas que ya tienen acuerdos con ellos. Por ejemplo, Reddit tiene un acuerdo de 60 millones de dólares con Google, lo que le permite a Google utilizar los datos de Reddit para sus proyectos de inteligencia artificial. Esto muestra que Reddit tiene cuidado con quién puede usar sus datos y quiere asegurarse de que sean socios confiables.
“Todos los que utilizan el contenido de Reddit deben seguir nuestras reglas para proteger a los usuarios de Reddit”, dijo Reddit en una publicación de blog. “Elegimos cuidadosamente con quién trabajamos y en quién confiamos el acceso al contenido de Reddit”.
Mirando hacia el futuro
Este cambio por parte de Reddit es parte de su esfuerzo por controlar cómo se utilizan sus datos, especialmente por parte de las empresas con fines comerciales. Muestra una tendencia creciente entre los sitios web a proteger su contenido en la era de la inteligencia artificial y los grandes datos.
La medida de Reddit envía un mensaje claro: si bien la IA tiene un gran potencial, respetar el origen de los datos y obtener permiso es realmente importante. A medida que Internet cambia, las acciones de Reddit podrían influir en cómo otros sitios web protegen su contenido y los derechos de los usuarios.
Todas las imágenes son generadas por Eray Eliaçık/Bing.





