<p>
<figcaption class="article-featured-image-caption">
<em>Image : Kimberly White / Getty pour TechCrunch</em>
</figcaption>
</p>
Définition de la Plagiat
La célèbre référence Merriam-Webster présente le plagiat comme le fait de “voler et faire passer pour ses propres idées ou mots d’une autre personne.” Pourtant, cette définition semble laisser perplexe Arvind Srinivas, le PDG d’une startup d’IA, Perplexity.
Selon un article de TechCrunch, Srinivas a eu du mal à définir le plagiat lorsqu’un journaliste lui a posé la question, une réaction surprenante étant donné que sa société a déjà été accusée de plagiat à plusieurs reprises. Pendant la conférence Disrupt 2024 organisée par TechCrunch, le silence de Srinivas au moment de la question a même suscité des rires dans le public.
Le journaliste a insisté : “Vous devez avoir une définition pour éviter de commettre cette erreur par inadvertance.” À cela, Srinivas a suggéré d’interroger Perplexity à ce sujet, ce qui a conduit à une réponse ironique du journaliste qui disait déjà le faire.
Srinivas s’est ensuite efforcé d’expliquer que sa priorité était de comprendre ce qu’est réellement le plagiat, affirmant que Perplexity cite systématiquement ses sources et ne prétend pas revendiquer le contenu qu’elle présente aux utilisateurs. Pourtant, cela contredit les allégations de nombreux médias, y compris le New York Times, qui a récemment envoyé une lettre de cessation à Perplexity pour lui demander de ne plus utiliser le travail de ses journalistes.
Bien que le PDG ait tenté d’expliquer sa vision, ses propos n’ont pas beaucoup éclairé la question. “Nous faisons émerger du contenu du web, l’assemblons de manière à ce qu’il soit compréhensible pour l’utilisateur,” a-t-il déclaré, comparant cela au travail des journalistes, universitaires et étudiants.
Mots en Guerre
Étonnamment, cette réponse vague semble mieux que ce que Perplexity a publié récemment concernant sa propre définition du plagiat. La semaine dernière, Srinivas a réagi à une plainte pour plagiat de NewsCorp qui accusait son entreprise d’avoir plagié les contenus du New York Post et du Wall Street Journal. Dans un article de blog, il a soutenu que les éditeurs préfèrent vivre dans un monde où les faits rapportés publiquement leur appartiennent, rendant ainsi toute utilisation de ces faits soumise à rémunération.
Cette déclaration n’aborde pas les préoccupations légitimes des éditeurs de nouvelles concernant l’utilisation massive du travail d’autrui sans citation correcte, ce qui pourrait être considéré comme une utilisation illégale de leur contenu.
La confusion de Srinivas sur scène contraste grandement avec la posture audacieuse de son article de blog, et au final, les deux messages semblent ignorer la problématique centrale.
Plus d’informations sur le plagiat en IA : Un lanceur d’alerte d’OpenAI est écœuré que son travail consisterait à collecter des données protégées par le droit d’auteur pour former ses modèles.
FAQ
Qu’est-ce que le plagiat exactement ?
Le plagiat est l’acte de s’approprier les idées ou expressions d’une autre personne sans lui attribuer le crédit qui lui revient. Cela inclut le copier-coller de textes, mais aussi des idées ou des œuvres.
Quelles conséquences le plagiat peut-il entraîner ?
Le plagiat peut avoir des conséquences graves comme des sanctions universitaires, des poursuites judiciaires, ou des atteintes à la réputation professionnelle.
Comment éviter le plagiat dans ses travaux ?
Pour éviter le plagiat, il est essentiel de toujours citer ses sources correctement, de paraphraser plutôt que de copier et d’utiliser des outils de vérification de plagiat avant de soumettre un travail.
Quelles technologies sont utilisées pour détecter le plagiat ?
Des logiciels comme Turnitin et Grammarly sont couramment utilisés par les institutions pour détecter et prévenir le plagiat, en comparant les documents soumis à une vaste base de données de contenu en ligne.
Pourquoi certaines entreprise d’IA sont-elles accusées de plagiat ?
Les entreprises d’IA peuvent être accusées de plagiat lorsqu’elles exploitent des contenus existants pour entraîner leurs modèles, souvent sans obtenir l’autorisation des créateurs des œuvres originales.
