OpenAI ha desarrollado una herramienta que podría identificar a los estudiantes que usan ChatGPT para completar sus tareas, pero no están seguros de si publicarla. El Wall Street Journal informó que la empresa está experimentando con un método llamado marca de agua de texto. Esta técnica implica realizar pequeños cambios en la forma en que ChatGPT selecciona las palabras, creando una “marca de agua” oculta en el texto que se puede detectar más tarde.
Un portavoz de OpenAI le dijo a TechCrunch que la compañía está siendo cautelosa al lanzar esta herramienta debido a sus complejidades y su posible impacto. Les preocupa que haya problemas como que la gente encuentre formas de eludir la marca de agua y la posibilidad de afectar injustamente a quienes no hablan inglés.
Es “muy preciso”
Este enfoque es diferente de los intentos anteriores de detectar texto generado por IA, que en su mayoría han fracasado. Por ejemplo, GPTZero, otra herramienta diseñada para detectar texto escrito por IA, enfrentó desafíos en cuanto a precisión y eficacia. Incluso OpenAI dejó de usar su propio detector de texto de IA el año pasado porque no era lo suficientemente preciso. La nueva herramienta de marca de agua se centraría únicamente en detectar texto escrito por ChatGPT, no por otros modelos de IA.

En una publicación de blog actualizada, OpenAI señaló que la marca de agua de texto ha sido “muy precisa” contra manipulaciones simples, como cambiar algunas palabras. Sin embargo, es menos eficaz contra métodos más complejos, como traducir el texto a otro idioma o usar otro modelo de IA para reformularlo. La empresa también mencionó preocupaciones de que esta herramienta podría estigmatizar injustamente el uso de IA, especialmente para hablantes no nativos de inglés que podrían usar IA para ayudar con la escritura.
Mientras OpenAI considera estos factores, se está tomando tiempo para decidir si lanzar o no esta herramienta, sopesando cuidadosamente los pros y los contras.
Todas las imágenes son generadas por Eray Eliaçık/Bing
Source: OpenAI sabe cómo detectar el trabajo de ChatGPT, pero duda en compartirlo

