Accusations controverse contre Meta
Meta est actuellement confrontée à des accusations concernant l’usage illégal de matériel protégé par des droits d’auteur pour former ses modèles d’intelligence artificielle. La défense de l’entreprise, dirigée par Mark Zuckerberg, semble peu convaincante.
Détails de l’affaire
Dans le cadre de l’affaire judiciaire Richard Kadrey et autres contre Meta Platforms, un groupe d’auteurs, comprenant le lauréat du prix Pulitzer Andrew Sean Greer et le lauréat du National Book Award Ta-Nehisi Coates, accuse Meta d’avoir extrait illégalement plus de sept millions de livres d’une bibliothèque piratée, LibGen. La société soutient que cette extraction constitue un usage équitable de ces œuvres, ce qui la dispenserait de toute illégalité.
Arguments discutables
Les défenses de Meta continuent de susciter des interrogations. Des avocats de la société affirment dans un article de Vanity Fair que les livres utilisés pour former leurs modèles de langage, qui valent des milliards, n’ont en réalité aucune valeur. Cela soulève des questions sur la légitimité de leur accès à ces œuvres.
Un expert engagé par Meta a même affirmé que l’impact d’un seul livre sur les performances de leurs modèles était négligeable, représentant moins de 0,06 % des performances selon les critères d’évaluation standards de l’industrie, un changement insignifiant comparé au bruit ambiant. En d’autres termes, selon Meta, il n’y a pas de marché pour rémunérer les auteurs, car leurs œuvres, prises individuellement, n’ont pas de « valeur économique » en tant que données d’entraînement. De plus, des communications internes indiquent que les employés de Meta ont retiré les pages de droits d’auteur des livres téléchargés.
Logique troublante
Cette situation illustre une logique douteuse et trompeuse que Meta et l’industrie de l’IA utilisent pour justifier la consommation de contenu créé par des humains. Selon Meta, ce contenu n’a pas vraiment de valeur, mais est néanmoins essentiel pour créer des IA qui seront, par exemple, en mesure de résoudre des problèmes de société tels que le changement climatique.
L’argument présenté par OpenAI devant le Parlement britannique l’année dernière renforce cette perspective : l’entreprise a soutenu qu’il n’y avait pas assez de matériel dans le domaine public pour enrichir ses modèles d’IA, justifiant ainsi la nécessité d’utiliser des œuvres protégées sans débourser un centime.
Une culture du silence ?
Il semble y avoir une compréhension tacite parmi les grandes entreprises d’IA : un chercheur de Meta a exprimé des doutes quant à savoir si l’équipe juridique avait autorisé l’utilisation de LibGen, et un autre a rétorqué qu’il ne s’est pas posé de questions, car c’est ce que font d’autres géants comme OpenAI avec GPT-3 ou Google avec PALM. Cela démontre une normalisation de pratiques qui, en théorie, devraient être discutées.
D’ailleurs, une politique non officielle semble guider ces entreprises à ne pas aborder ces sujets. Un document interne de Meta stipulait qu’ils ne divulgueraient pas publiquement leur utilisation de LibGen, et qu’une couverture médiatique sur cette utilisation pourrait affaiblir leur position lors des négociations avec les régulateurs.
Conclusion
Cette affaire soulève des préoccupations sur les pratiques de collecte de données par les géants de la technologie et les implications pour les droits des auteurs. Si ces entreprises continuent à minimiser la valeur du travail créatif, cela pourrait avoir des conséquences néfastes sur la rémunération des artistes.
FAQ
Quel est le principal problème soulevé dans cette affaire ?
Le problème principal réside dans l’accusation selon laquelle Meta aurait utilisé illégalement des œuvres protégées par des droits d’auteur pour former ses modèles d’IA.
Qu’est-ce que « l’usage équitable » ?
L’usage équitable est une notion juridique qui permet, dans certains contextes, d’utiliser des œuvres protégées sans autorisation, à condition que cela ne nuise pas aux intérêts économiques des détenteurs des droits.
Pourquoi Meta insiste-t-elle sur le manque de valeur des livres ?
Meta avance que les livres individuels n’ont pas assez d’impact sur les performances de leurs modèles d’IA, justifiant ainsi de ne pas rémunérer les auteurs pour leur utilisation.
Quel rôle jouent les grandes entreprises d’IA dans ce débat ?
Les grandes entreprises de technologie cherchent à établir des normes qui leur permettent d’accéder librement à des œuvres protégées, ce qui pourrait nuire aux droits et revenus des créateurs.
Quelles pourraient être les conséquences pour les droits d’auteur ?
Si ces pratiques se généralisent, cela pourrait dévaluer le travail des auteurs et réduire leur capacité à gagner des revenus grâce à leur création, compromettant ainsi l’intégrité de l’industrie créative.
