El equipo de ingeniería de X publicó el código de su algoritmo de recomendación “para usted” el mes pasado. Elon Musk describió la publicación como una victoria para la transparencia y afirmó: “Sabemos que el algoritmo es tonto y necesita mejoras masivas, pero al menos pueden vernos luchar para mejorarlo en tiempo real y con transparencia”. Musk añadió: “Ninguna otra empresa de redes sociales hace esto”.

X es la única red social importante que abre elementos de código abierto de su algoritmo de recomendación. Sin embargo, los investigadores argumentan que el código publicado proporciona una transparencia limitada para comprender las operaciones de la plataforma en 2024. El código se parece a una versión redactada publicada en 2023, según John Thickstun, profesor asistente de informática en la Universidad de Cornell.

Thickstun dijo a Engadget: “Lo que me preocupa de estos lanzamientos es que dan la impresión de que están siendo transparentes al publicar el código y la sensación de que alguien podría utilizar este lanzamiento. hacer algún tipo de trabajo de auditoría o de supervisión, y el hecho es que eso no es posible en absoluto”.

Tras el lanzamiento, los usuarios de X compartieron extensos hilos que interpretaban el código para asesorar a los creadores sobre cómo aumentar la visibilidad. Una publicación, vista más de 350.000 veces, afirmaba que X “recompensará a las personas que conversan” y “elevará las vibraciones de X”. Otra publicación, con más de 20.000 visitas, afirmó que publicar vídeos es clave. Una tercera publicación recomendó ceñirse a un “nicho” porque “el cambio de tema perjudica su alcance”.

  Los nuevos controles parentales de WhatsApp bloquearán a los extraños

Thickstun advirtió contra la derivación de estrategias de viralidad a partir del código. “No pueden sacar esas conclusiones de lo que se publicó”, dijo. El código revela detalles operativos menores, como filtrar contenido de más de un día. Thickstun describió gran parte de la información como “no procesable” para los creadores de contenido.

Un cambio estructural significativo separa el algoritmo actual de la versión 2023. El nuevo sistema utiliza un modelo de lenguaje grande similar a Grok para clasificar las publicaciones. Ruggero Lazzaroni, Ph.D. Un investigador de la Universidad de Graz explicó la diferencia: “En la versión anterior, esto estaba codificado: tomabas cuántas veces le gustaba algo, cuántas veces se compartía algo, cuántas veces se respondía algo… y luego, basándose en eso, calculabas una puntuación y luego clasificabas la publicación según la puntuación”.

“Ahora la puntuación no se deriva de las cantidades reales de “me gusta” y “compartidos”, sino de la probabilidad de que Grok piense que te gustaría compartir una publicación”, continuó Lazzaroni. Este cambio aumenta la opacidad, según Thickstun. “Mucha parte de la toma de decisiones… ocurre dentro de redes neuronales de caja negra que están entrenando con sus datos”, dijo. “Cada vez más, el poder de toma de decisiones de estos algoritmos está saliendo no sólo de la vista del público, sino realmente fuera de la vista o de la comprensión incluso de los ingenieros internos que están trabajando en estos sistemas, porque están siendo trasladados a estas redes neuronales”.

  Google Gemini ahora admite la carga de archivos de audio

La nueva versión omite detalles revelados anteriormente en 2023 sobre la ponderación de las interacciones para la clasificación. En 2023, X especificó que una respuesta equivalía a 27 retuits y una respuesta que generaba una respuesta del autor original equivalía a 75 retuits. X eliminó estas ponderaciones en el último código, citando “razones de seguridad”.

El código no proporciona información sobre los datos de entrenamiento del modelo. Mohsen Foroughifar, profesor asistente de tecnologías empresariales en la Universidad Carnegie Mellon, enfatizó esta brecha: “Una de las cosas que realmente me gustaría ver es cuáles son los datos de entrenamiento que están usando para este modelo. Si los datos que se usan para entrenar este modelo están inherentemente sesgados, entonces el modelo podría terminar estando sesgado, independientemente del tipo de cosas que se consideren dentro del modelo”.

Lazzaroni, que trabaja en un proyecto financiado por la UE que simula plataformas de redes sociales para probar enfoques de recomendación, señaló que el código carece del modelo en sí. “Tenemos el código para ejecutar el algoritmo, pero no tenemos el modelo que se necesita para ejecutar el algoritmo”, dijo. Esto impide que los investigadores reproduzcan el algoritmo de X.

Estudiar el algoritmo tiene valor más allá de las redes sociales. Thickstun observó que los desafíos con las recomendaciones de las redes sociales reflejan los problemas de los chatbots de IA. “Muchos de estos desafíos que estamos viendo en las plataformas de redes sociales y los [sistemas] de recomendación también aparecen de manera muy similar con estos sistemas generativos”, dijo. “Por lo tanto, se pueden extrapolar los tipos de desafíos que hemos visto con las plataformas de redes sociales al tipo de desafíos que veremos con la interacción con las plataformas GenAI”.

  Rivian anuncia asistente de IA para R1T y R1S

Lazzaroni, que simula comportamientos tóxicos en las redes sociales, criticó las prioridades en el desarrollo de la IA. “Compañía de IA”Es, para maximizar las ganancias, optimizar los grandes modelos lingüísticos para la participación de los usuarios y no para decir la verdad o preocuparse por la salud mental de los usuarios”, dijo. “Y este es exactamente el mismo problema: obtienen más ganancias, pero los usuarios obtienen una sociedad peor, o obtienen una peor salud mental”.

El lanzamiento se produjo el mes pasado, y la versión 2023 sirvió como punto de referencia previo. El enfoque de X contrasta con otras plataformas, como señaló Musk, aunque los investigadores cuestionan su utilidad para la supervisión o auditoría. Las interpretaciones de los usuarios proliferaron inmediatamente, a pesar de las advertencias de los expertos sobre las limitaciones del código. La transición a una clasificación basada en redes neuronales reemplaza los recuentos explícitos de interacciones con predicciones de modelos, lo que oscurece aún más los procesos. Las redacciones cubren tanto las ponderaciones como los detalles de la capacitación, lo que limita el análisis externo.

Thickstun destacó las implicaciones del cambio para la comprensión tanto interna como externa. El enfoque de Foroughifar en los datos de capacitación subraya los riesgos de sesgo. El desafío de reproducción de Lazzaroni bloquea la investigación basada en simulación. Estos elementos en conjunto disminuyen las afirmaciones de transparencia del comunicado, según los investigadores.

Crédito de imagen destacada