Se ha introducido un nuevo estándar de licencia, Really Simple Licensing (RSL), para permitir a los editores web definir los términos bajo los cuales los desarrolladores de sistemas de inteligencia artificial pueden utilizar su contenido. La iniciativa tiene como objetivo establecer un marco para que las empresas de IA compensen a los editores por utilizar sus datos para entrenar modelos de IA.
El miércoles, organizaciones destacadas como Reddit, Yahoo, Medium, Quora y People Inc. anunciaron su apoyo al estándar RSL, un protocolo de licencia de contenido abierto. Este estándar permite a los editores especificar cómo deben pagar los bots para extraer de sus sitios datos de entrenamiento de IA, con el objetivo de influir colectivamente en las empresas de IA para que adopten el marco.
El estándar RSL amplía el protocolo robots.txt existente, que históricamente ha permitido a los editores indicar a los rastreadores web a qué partes de su sitio pueden y no pueden acceder. RSL mejora esto al permitir que los sitios web incluyan términos de licencia y regalías dentro de su archivo robots.txt. Estos términos también pueden integrarse en libros, vídeos y conjuntos de datos de formación en línea, lo que permite a los editores solicitar una compensación por su uso.
El Colectivo RSL, una organización de derechos humanos recién formada, está detrás del Estándar RSL. Está dirigido por Eckart Walther, cocreador del estándar Really Simple Syndication (RSS) y ex director ejecutivo de CardSpring, y Doug Leeds, ex director ejecutivo de IAC Publishing y Ask.com. Walther afirmó: “El objetivo es crear un modelo de negocio nuevo y escalable para la web. RSL toma algunas de esas primeras ideas de RSS y crea una nueva capa para toda Internet donde se definen los derechos de licencia y los derechos de compensación”.
El estándar RSL admite varios modelos de licencia, incluidas opciones gratuitas. Los propietarios de sitios pueden solicitar que las empresas de inteligencia artificial paguen una tarifa de suscripción o una tarifa de pago por rastreo a través del estándar RSL, que se cobrará cada vez que un robot de inteligencia artificial rastree el sitio web. Además, se puede implementar una tarifa de pago por inferencia, lo que permite a los sitios recibir una compensación cuando un modelo de IA hace referencia a su trabajo para generar una respuesta. Los robots que rastrean sitios con otros fines, como archivos o inclusión en motores de búsqueda, pueden continuar como de costumbre.
Varias empresas de medios, incluidas Vox Media (empresa matriz de The Verge), News Corp (propietaria de The Wall Street Journal) y The New York Times, ya han establecido acuerdos de licencia con empresas individuales de inteligencia artificial como OpenAI y Amazon. El RSL Collective tiene como objetivo agilizar este proceso, permitiendo que cualquier propietario o creador de un sitio web reciba un pago por su trabajo sin tener que negociar acuerdos por separado.
El éxito de RSL depende de la adopción por parte de los principales actores de la industria, en particular las empresas de inteligencia artificial. Los creadores de modelos de IA se han enfrentado a acusaciones de ignorar los archivos robots.txt de los sitios y actualmente no existe un método sencillo para rastrear las tarifas de inferencia sin su cooperación. El Colectivo RSL confía en la influencia colectiva de los principales editores web para hacer que la adopción del estándar sea más atractiva. Leeds declaró: “Nuestro trabajo es salir y lograr que un gran grupo de personas diga que es de su interés, de manera eficiente, porque puede negociar con todos a la vez, y legalmente, porque si no lo hace, está violando a todos a la vez”.
A diferencia de sistemas como el “pago por rastreo” de Cloudflare, el estándar RSL por sí solo no puede impedir que los bots visiten un sitio web. RSL Collective está colaborando con Fastly, una red de distribución de contenidos, para controlar el acceso de los robots de IA a los sitios web en función de si han aceptado licenciar el contenido. Leeds describió a Fastly como “el portero en la puerta del club, y no deja entrar a la gente a menos que tenga la identificación correcta. RSL está emitiendo las identificaciones. Entonces decimos: ‘Oye, has aceptado licenciar este contenido’, y Fastly dice: ‘Vamos, en tu identificación verifica'”.
Leeds cree que el Colectivo RSL puede hacer cumplir legalmente las licencias, afirmando que “todos los participantes en la organización de derechos colectivos participan en la aplicación de cualquier infracción”, repartiendo así los costos legales. Comparó este sistema con las organizaciones de derechos digitales existentes, como el grupo de derechos musicales ASCAP, que recauda y distribuye tarifas de licencia a sus miembros. Si bien las licencias de música convencionales se benefician de un sólido precedente legal para la protección de los derechos de autor, el scraping no autorizado y el uso de medios para entrenar sistemas de inteligencia artificial siguen estando en un área legal gris. Los principales actores de la IA se enfrentan actualmente a demandas de entidades como Reddit, Getty Images y varios editores en línea.
Leeds y Walther declararon: “Siempre ha existido la cuestión de si los bots han aceptado términos que no ven. RSL cambia eso fundamentalmente, avisando a los rastreadores de cuáles son los términos antes de acceder a un sitio”.
Leeds espera que el sistema cree una forma intuitiva de navegar por las licencias.sing trabaja para el entrenamiento de IA y afirma: “Lo que estamos haciendo no es reinventar ruedas ni inventar ruedas; simplemente las estamos llevando a un lugar en el que no existían antes. La razón por la que no existían aquí antes es porque no tenían un estándar sobre el que pudiéramos construir. Por eso, RSL Standard es tan importante: brinda la infraestructura para luego crear las cosas que han funcionado en todas las demás industrias de medios y que aún no han sucedido”.
RSL Collective es gratuito para que los editores y creadores se unan. Otras marcas importantes como O’Reilly, wikiHow y Ziff Davis (propietario de IGN) también se han unido a la organización.








