OpenAI borró accidentalmente datos cruciales relacionados con su demanda de derechos de autor con The New York Times durante procedimientos legales en curso sobre reclamos por infracción de derechos de autor. El incidente involucró datos de máquinas virtuales dedicadas proporcionadas a los demandantes, que OpenAI reconoció ante el tribunal en una presentación reciente. Como resultado, los abogados del Times han declarado que perdieron una semana de trabajo relacionado con el caso.
OpenAI enfrenta un revés por pérdida de datos en una demanda con The New York Times
Según una carta del equipo legal del Times, esta pérdida de datos implicó “una semana entera de trabajo de sus expertos y abogados” y se “perdió irremediablemente”. Los demandantes estaban investigando acusaciones de que los modelos de OpenAI habían sido entrenados en contenido no autorizado. Como parte de este proceso, acumularon datos durante 150 horas de investigación intensiva sobre los conjuntos de datos de entrenamiento de OpenAI, buscando específicamente casos de infracción de derechos de autor. Un informe de TechCrunch indicó que la eliminación se produjo el 14 de noviembre, cuando “los ingenieros de OpenAI borraron los programas y los datos de resultados de búsqueda almacenados en una de las máquinas virtuales dedicadas”.
El núcleo de la demanda afirma que OpenAI, junto con Microsoft (su socio que utiliza la tecnología de OpenAI para su chatbot Bing AI) ha infringido los derechos de autor del New York Times al utilizar contenido de pago sin autorización. El Times afirma que los modelos de OpenAI produjeron réplicas “casi palabra por palabra” de sus artículos, formando su argumento a favor de los daños y perjuicios. OpenAI ha refutado consistentemente estas acusaciones, afirmando que su capacitación se basó en datos disponibles públicamente, lo que califica como uso legítimo según las leyes de derechos de autor.
Un portavoz de OpenAI comentó que el incidente fue un “fallo técnico”. Al mismo tiempo, recuperaron con éxito la mayoría de los datos eliminados y los elementos críticos, incluida “la estructura de carpetas y los nombres de los archivos”, permanecen perdidos y, en consecuencia, inutilizables. Como resultado, los abogados del Times ahora enfrentan el desafío de reiniciar su recolección de evidencia desde cero. A pesar de las circunstancias, informaron no tener “ninguna razón para creer [the erasure] fue intencional”, enfatizando que OpenAI está mejor posicionado para buscar en sus conjuntos de datos. Sin embargo, también notaron la renuencia de la compañía a revelar detalles sobre sus datos de capacitación.

Para complicar aún más las cosas, han surgido reclamaciones de derechos de autor similares contra OpenAI. Una demanda reciente contra la empresa presentada por Raw Story y AlterNet fue desestimada porque los demandantes no pudieron proporcionar pruebas suficientes del daño relacionado con sus acusaciones. Por el contrario, se informa que The New York Times ha invertido más de 1 millón de dólares en honorarios legales para continuar su caso contra OpenAI. Este compromiso financiero ilustra el desafío distintivo de las editoriales más pequeñas cuando compiten con empresas de tecnología importante.
OpenAI, por otro lado, ha firmado recientemente acuerdos de licencia con varias empresas de medios importantes, permitiendo el uso de su contenido para entrenar sus modelos de IA, proporcionando así compensación y crédito. Los informes indican que OpenAI está pagando al gigante editorial Dotdash Meredith al menos 16 millones de dólares al año por derechos de licencia, lo que refleja su estrategia de buscar asociaciones formales en lugar de litigios en curso.
Crédito de imagen: Furkan Demirkaya/Ideograma
La publicación El problema legal del NewYork Times se profundiza cuando OpenAI elimina accidentalmente datos importantes apareció por primera vez en TechBriefly.





