

ChatGPT
Encyclopaedia Britannica y Merriam-Webster han abierto un frente judicial contra OpenAI. Ambos diccionarios sostienen que la compañía de inteligencia artificial propietaria de ChatGPT habría usado sin permiso una amplia parte de su contenido para entrenar a su chatbot más famoso y a otros modelos. Además, sostiene que ese material seguiría apareciendo, total o parcialmente, en algunas respuestas de la herramienta.
El caso no se limita a una discusión técnica sobre cómo se entrenan los modelos de IA. También pone sobre la mesa qué ocurre cuando un chatbot responde directamente a una pregunta que antes llevaba al usuario a consultar una enciclopedia, un diccionario o un medio digital. Para los editores, ahí no solo está en juego el copyright, sino también el tráfico, los ingresos y su control sobre la información publicada.
Según la demanda, presentada en un tribunal federal de Manhattan, Britannica asegura que OpenAI copió cerca de 100.000 artículos y entradas de referencia para entrenar sus modelos de lenguaje. También afirma que ChatGPT puede devolver resúmenes casi calcados a sus textos, algo que, a su juicio, va más allá de un uso legítimo del material original. Por su parte, OpenAI mantiene en otros litigios similares que sus sistemas se entrenan con datos públicamente accesibles bajo el principio de uso justo.
La acusación añade otro elemento importante. Britannica sostiene que OpenAI también usa sus contenidos dentro de sistemas de recuperación de información, una técnica con la que el modelo consulta fuentes externas para responder con datos más recientes. En otras palabras, no sería solo un problema del entrenamiento inicial, sino también del modo en que el chatbot se apoya en información ajena cuando contesta. A eso se suma una reclamación por supuestas atribuciones falsas a Britannica en respuestas inventadas por la IA, lo que, según la editorial, puede dañar su reputación.
El pleito llega en un momento especialmente sensible para el sector. OpenAI ya se enfrenta a demandas de otros editores y grupos de medios, mientras los tribunales aún no han fijado una doctrina definitiva sobre si entrenar una IA con obras protegidas vulnera o no el copyright. En paralelo, Britannica ya había demandado a Perplexity por motivos parecidos, así que no es algo nuevo en el sector.
Por otro lado, un fallo reciente favorable a Anthropic apuntó que ese uso puede considerarse transformador, aunque también dejó claro que la forma de obtener los materiales sigue siendo un punto crítico.