El veredicto inmediato entre los expertos legales fue que la desestimación por parte de un juez federal el 7 de noviembre de una demanda por infracción de derechos de autor contra OpenAI, el líder en chatbots avanzados, interrumpiría un esfuerzo creciente de artistas y escritores para evitar que las empresas de IA roben su inteligencia artificial. contenido
no hay duda El veredicto se emitió el jueves. de la jueza Colleen McMahon en Nueva York causó revuelo entre los abogados que intentaban presentar casos similares.
McMahon acaba de aprobar la desestimación de una demanda contra OpenAI por parte de Raw Story Media, el propietario de los principales sitios web de noticias. Descartó el principal argumento que los creadores de contenido han esgrimido contra las empresas de IA: el proceso de transferir datos de sus modelos de IA a través de Internet implica inevitablemente el uso de contenido protegido por derechos de autor sin permiso.
No le daría mucha importancia a que nadie le dijera cómo se manejan estos casos.
– Experto en derechos de autor Aaron Moss
La decisión de McMahon, basada en la decisión de la Corte Suprema en un caso relacionado, “podría dejar en el limbo los reclamos de derechos de autor de IA. en el suelo inestable”, escribió el abogado de propiedad intelectual de Los Ángeles, Aaron Moss, en su sitio web. El juez no sólo desestimó el caso de Raw Story; quiso decir que ningún titular de derechos de autor podría demostrar suficiente daño por parte de la IA como para ganar un caso de infracción.
Esto se debe a que la cantidad de contenido que los bots de IA, como ChatGPT de OpenAI, reciben para “entrenarlos” es tan grande que es difícil identificar cualquier contenido específico que se rompa cuando el bot responde a la solicitud del usuario, casi imposible.
Boletín
Obtenga lo último de Michael Hiltzik
Comentario sobre economía y más de un ganador del Premio Pulitzer.
Es posible que ocasionalmente recibas contenido promocional de Los Angeles Times.
“Dada la cantidad de información”, dijo McMahon, “es muy poco probable que ChatGPT haya plagiado contenido de uno de los [Raw Story’s] Los artículos parecen distantes.”
La decisión de McMahon también podría alterar lo que ha sido una tendencia creciente de que los desarrolladores de IA concedan licencias de contenido protegido por derechos de autor, en parte para evitar reclamaciones por infracción de derechos de autor. Dow Jones, matriz del Wall Street Journal, llegó a un acuerdo de licencia con OpenAI en mayo que podría vale más de 250 millones de dólares más de cinco años. Luego vinieron los acuerdos de licencia multimillonarios de OpenAI con Axel Springer, propietario de Business Insider y Politico; Tiempos financieros; y la agencia Associated Press.
“Este tribunal permite que este creciente y lucrativo mercado de contenido con licencia para el aprendizaje de IA reemplace a Raw Story Media”, me dijo Peter Xati, presidente de Creative Media, una firma de consultoría, marketing y entretenimiento con sede en Los Ángeles.
Esto puede haber sucedido porque Raw Story no captó el potencial de este mercado en su reclamo. En su denuncia, citó los acuerdos de licencia de OpenAI con Associated Press y Axel Springer, pero solo señaló que la empresa de IA “no proporcionó ninguna compensación” a Raw Story.
Dicho todo esto, el significado total de la decisión de McMahon no está nada claro. Esto se debe a que el caso reúne dos regímenes legales confusos: la ley de derechos de autor, notoria por su locura y confusión; y la ley de IA, que pueden tardar años en converger en armonía.
Al menos 12 reclamaciones contra los desarrolladores de IA que alegan infracciones de derechos de autor se está abriendo camino actualmente en los tribunales federales, y entre los demandantes se encuentran los editores de Mother Jones, el Wall Street Journal y el New York Times; industria discográfica; y los escritores Michael Chabon y Sarah Silverman.
Las decisiones de los tribunales intermedios en estos casos son contradictorias y plantean cuestiones que ni siquiera abordan las leyes de propiedad intelectual de alta tecnología.
Los jueces incluso llegaron a determinar cómo se aplican los principios de infracción de derechos de autor a la tecnología que no crea copias exactas de obras protegidas por derechos de autor, sino que las “imita”, en lugar de cómo se aplica una máquina expendedora “La guía del autoestopista galáctico” de Douglas. Adams ganó “una copa”. Era un líquido que era casi, pero no del todo, diferente del té”.
Todos estos casos se encuentran todavía en sus primeras etapas. “No le doy mucha importancia a que nadie le diga cómo van a terminar estos casos”, dice Moss.
Antes de que estas demandas intenten llegar al ámbito legal, echemos un vistazo rápido a cómo se ha desarrollado la tecnología y por qué los derechos de autor se han convertido en un problema.
Los modelos que actualmente están a la vanguardia de la investigación y el desarrollo de inteligencia artificial no piensan por sí mismos. Son depósitos de miles de millones de artículos, líneas de software y música o arte creados por personas. Cuando se les hace una pregunta, se desplazan por su base de datos e intentan sintetizar la respuesta más probable. La mayoría de las veces lo hacen bien; a menudo cometen errores.
A veces están lo suficientemente confundidos como para cometer errores obvios, como hacen los investigadores de Apple cuando piden a modelos que resuelvan problemas matemáticos escritos en inglés sencillo. A veces fingen que no saben lo que no saben y llenan sus puntuaciones de conocimientos con mentiras o, como las llaman los desarrolladores de IA, “alucinaciones”.
Como observó McMahon, el gran volumen de material del que extraen los robots y el proceso de síntesis hace que sea poco probable que cualquier respuesta replique algún contenido específico.
Esto se ha convertido en un obstáculo para algunos demandantes en casos de derechos de autor. La mayoría de los que afirman que su contenido escrito ha sido pirateado básicamente dicen que la base de datos conocida alimentada por algunos modelos de IA incluye libros u otros escritos. (Al menos uno de los repositorios de contenido utilizados por algunos desarrolladores de IA incluye tres de mis propios libros, pero no participo en ninguna de las afirmaciones).
en su reclamoEl New York Times cita el texto ChatGPT-4 de OpenAI y reproduce partes de sus artículos sin crédito ni permiso. (Microsoft, que figura como demandado como inversor en OpenAI y usuario de su tecnología, respondió que el New York Times efectivamente “activado” el chatbot (reproducir sus textos enmarcando artísticamente sus consultas para encontrar respuestas disruptivas).
Esto nos lleva de vuelta al reclamo de Raw Story Media. Una empresa que trabaja historia cruda y AlterNet Los sitios de noticias no convirtieron su reclamo en una denuncia por infracción de derechos de autor. En cambio, argumentó que OpenAI eliminó deliberadamente el autor, el título y las marcas de derechos de autor, conocidas colectivamente como información de gestión de derechos de autor, o CMI, de los artículos que importaba para entrenar a sus robots.
Raw Story argumentó que este proceso facilitaría futuras infracciones, dejando a los usuarios sin saber que estaban tomando y posiblemente distribuyendo material protegido por derechos de autor sin permiso.
Restablecer CMI para hacer cumplir la infracción de derechos de autor es una violación directa de la Ley de Derechos de Autor del Milenio Digital de 1998, que rige los derechos de propiedad intelectual de los productores de contenido digital. Raw Story ha solicitado una indemnización por violar la Ley OpenAI y exige que la empresa de IA elimine todo el contenido de Raw Story de su base de datos, de la que se eliminó CMI.
Ahí es donde Raw Story se topó con un obstáculo puesto por la Corte Suprema. En una decisión de 5-4 que involucra a la oficina de crédito TransUnion En 2021, el tribunal declaró que no era suficiente que un demandante alegara la violación de la ley federal por parte del demandado. El tribunal dijo que para presentar un caso federal, el demandante debe demostrar que sufrió un “daño específico” por la violación.
Raw Story no pudo demostrar esto porque no pudo probar que alguno de sus contenidos fue copiado en respuesta a las solicitudes de los usuarios y, por lo tanto, sufrió un “daño específico”. Como resultado, McMahon desestimó la demanda alegando que Raw Story era incapaz de presentarla.
De hecho, McMahon estaba furioso ante la idea de que Raw Story estuviera tratando de apretar el gatillo. “Seamos claros sobre lo que realmente está en juego aquí”, escribió. La supuesta lesión por la que Raw Story solicitó reparación, escribió, no fue “la exclusión de CMI” de la base de datos OpenAI, sino “usar Artículos de los Demandantes por desarrollar Chat GPT sin compensación a los Demandantes.
McMahon permitió que Raw Story reafirmara su afirmación para demostrar que resultó perjudicada por las acciones de OpenAI. No parecía bloqueado, calificándose a sí mismo como “dudoso” de que la compañía pudiera presentar un reclamo por “daños reconocibles”.
Pero Xati afirma que McMahon pasó por alto la posibilidad de que su fallo pudiera perturbar el mercado de licencias: si los desarrolladores de IA pueden eliminar CMI de los datos de entrenamiento con impunidad, no sentirán la necesidad de licenciar material protegido por derechos de autor en el futuro. “Hay dinero real ahí”, dice.
Raw Story puede citar la pérdida de ingresos por licencias como “daños reconocibles” siempre que presente una queja enmendada. Sería un nuevo problema en un campo que actualmente no tiene más que extremidades.