Intelligence Artificielle

Encyclopedia Britannica Intente un Procès Menaçant à OpenAI

Encyclopedia Britannica Intente un Procès Menaçant à OpenAI

Les auteurs sont souvent avertis de ne pas submerger leurs lecteurs avec un vocabulaire trop complexe. Mais que se passe-t-il si c’est le dictionnaire lui-même qui agit avec brutalité ?

Récemment, l’Encyclopédie Britannica et sa filiale Merriam-Webster ont décidé de réagir face à l’utilisation abusive de leurs ressources par des modèles de langage artificiels. Ils ont intenté un procès contre OpenAI, l’accusant d’utiliser ses matériaux protégés par le droit d’auteur pour entraîner ses modèles d’IA “à grande échelle”. Cette action juridique s’inscrit après une plainte préalable déposée contre Perplexity.AI.

Dans la plainte rapportée par Reuters, Britannica affirme qu’OpenAI aurait illégalement copié près de 100,000 articles de ses ouvrages en ligne pour alimenter ses modèles GPT. Selon eux, ChatGPT produit même des reproductions “quasi verbatim” de ses contenus, ce qui est fréquemment constaté chez de nombreux chatbots.

Au-delà de cela, Britannica accuse OpenAI d’avoir “cannibalisé” son trafic web en fournissant à ses utilisateurs des résumés générés par IA de son contenu, ce qui a un impact négatif sur ses revenus.

Ce point de vue rejoint les préoccupations exprimées par les médias et d’autres plateformes en ligne, qui voient leur trafic diminuer alors que les utilisateurs se tournent de plus en plus vers des chatbots IA au lieu d’engines de recherche traditionnels.

Dans sa plainte, Britannica déclare que ChatGPT prive des éditeurs web comme elle de revenus en fournissant des réponses aux requêtes des utilisateurs qui remplacent, et concurrencent directement, le contenu des éditeurs.

En invoquant une loi fondamentale sur les marques aux États-Unis, connue sous le nom de Lanham Act, Britannica accuse en outre OpenAI d’enfreindre ses droits de marque lorsque ChatGPT invente de fausses réponses et les attribue incorrectement à Britannica. Cette situation donne également l’impression trompeuse que l’utilisation de son contenu est approuvée par l’encyclopédie.

Cette plainte s’ajoute à une série d’autres actions judiciaires majeures que des auteurs, éditeurs et agences de presse ont engagées contre des entreprises d’IA, dont la plupart sont toujours en cours. Les résultats de ces affaires pourraient avoir des implications considérables sur le fonctionnement des entreprises d’IA générative. Toutefois, la question reste ouverte de savoir si l’utilisation de contenus protégés pour entraîner des modèles d’IA sans autorisation constitue une violation de droits — une incertitude aggravée par le manque de transparence des développeurs d’IA sur les sources de leur matériel d’entraînement.

L’une des affaires les plus marquantes ayant obtenu une conclusion jusqu’à présent concerna un groupe d’auteurs contre Anthropic. Il a été révélé qu’Anthropic avait piraté des millions de livres numériques pour entraîner son chatbot Claude et avait également scanné et détruit des millions d’autres ouvrages physiques. Le juge a déclaré que l’utilisation des textes par Anthropic pour former son IA était “transformative”, mais a considéré que l’utilisation de copies piratées était illégale. Anthropic a ensuite accepté un règlement avec les auteurs d’un montant de 1,5 milliard de dollars.

Plus sur l’IA : Les dirigeants d’OpenAI paniquent et réduisent leurs projets face à la pression croissante.

### FAQ

#### Quelles sont les conséquences possibles de ces poursuites ?
Ces procès pourraient établir de nouveaux précédents juridiques concernant les droits d’auteur et l’utilisation de contenus protégés par des entreprises d’IA.

#### Quels types de contenus sont souvent utilisés sans autorisation dans ces affaires ?
Les données utilisées pour entraîner les modèles comprennent fréquemment des articles, des livres, et d’autres publications protégées par des droits d’auteur.

#### Pourquoi le modèle économique des éditeurs est-il menacé par l’IA ?
Avec l’augmentation de l’utilisation des chatbots IA, les éditeurs traditionnels subissent une baisse de trafic et de revenus, car les utilisateurs privilégient les réponses rapides des IA plutôt que de consulter des sources directes.

#### Quels sont les enjeux pour la transparence dans le développement de l’IA ?
Le manque de clarté quant aux sources des matériel d’entraînement pose un problème éthique, surtout en ce qui concerne le respect des droits d’auteur.

#### Comment les entreprises d’IA peuvent-elles se conformer aux lois sur le copyright ?
Les entreprises doivent s’assurer qu’elles obtiennent les licences nécessaires ou utilisent des contenus libres de droits pour éviter les poursuites judiciaires.

Quitter la version mobile