Intelligence Artificielle

Démystification du Plagiat : Les révélations sur l’Intelligence Artificielle de CNET

Démystification du Plagiat : Les révélations sur l'Intelligence Artificielle de CNET

Au départ, le site a cherché à apaiser le mécontentement général concernant les articles générés par des bots, en rassurant les lecteurs que tous les contenus étaient vérifiés par un éditeur humain avant publication.

Cependant, des enquêtes menées par Futurism ont révélé que de nombreuses erreurs figuraient dans les articles publiés par l’IA. Le célèbre site de technologie, CNET, qui avait été vendu pour 1,8 milliard de dollars en 2008, a réagi en publiant une correction majeure et en avertissant que le contenu précédent de l’IA était sous contrôle factuel. Quelques jours plus tard, sa société mère, Red Ventures, a annoncé lors de réunions internes qu’elle suspendait temporairement la publication d’articles générés par l’IA sur CNET et d’autres plateformes comme Bankrate, au moins jusqu’à ce que la tempête médiatique se calme.

Récemment, une nouvelle enquête de Futurism a mis en lumière des similarités frappantes dans les travaux de l’IA de CNET, y compris des preuves que certains contenus étaient plagiés directement d’articles publiés ailleurs, sans crédit. En d’autres termes, il apparaît que le bot a copié le travail de concurrents de Red Ventures ainsi que d’écrivains humains.

Jeff Schatten, professeur à l’Université Washington et Lee, a examiné de nombreux exemples fournis et a conclu qu’ils pourraient clairement être considérés comme du plagiat.

Lorsqu’on lui a demandé ce qu’il adviendrait si un étudiant présentait un essai comportant un nombre similaire de similitudes par rapport à des documents existants sans attribution, il a répondu :

« Ils seraient envoyés au conseil d’éthique des étudiants et, compte tenu de la répétition de ce comportement, seraient presque certainement expulsés de l’université. »

Les manquements de l’IA vont de la copie intégrale à des modifications légères ou à des reformulations importantes, le tout sans créditer correctement les sources originales. Dans certains articles, il semble que presque chaque phrase corresponde directement à quelque chose déjà publié ailleurs.

Prenons un extrait de l’un des derniers articles de l’IA de CNET concernant la protection contre les découverts :

Comment éviter les frais de découvert et de NSF

A lire :  L'Algorithme de Facebook Classe les Oignons comme 'Trop Sexualisés'

Les frais de découvert et de NSF ne doivent pas être une conséquence fréquente. Quelques étapes peuvent vous aider à les éviter.

Comparons cela à un extrait d’un article publié antérieurement dans Forbes Advisor, un concurrent de Red Ventures :

Comment Éviter les Frais de Découvert et de NSF

Les frais de découvert et de NSF ne doivent pas être standards. Plusieurs outils peuvent vous aider à les éviter.

Bien que la version de l’IA ait modifié la capitalisation et échangé quelques mots pour des synonymes, les deux phrases restent presque identiques.

Voici un autre extrait de l’article de l’IA de CNET :

Inscrivez-vous pour des alertes de solde bas.

vous pouvez recevoir des alertes de solde bas via l’application mobile de votre banque afin de savoir si votre solde descend en dessous d’un certain seuil.

Comparez cela à un extrait d’un autre article publié dans The Balance, un autre concurrent :

Inscrivez-vous pour des alertes de solde bas.

Vous pouvez vous inscrire pour recevoir des alertes de solde bas à travers la plupart des banques pour vous avertir lorsque votre solde atteint un certain montant.

Les similitudes sont impossibles à ignorer, l’IA fait simplement quelques ajustements pour dissimuler la source.

Parfois, ces ressemblances peuvent paraître presque risibles. Prenons la première phrase d’un autre article de l’IA de CNET :

Les cartes-cadeaux sont un choix facile pour un cadeau.

Et la première phrase d’un article de Forbes :

Les cartes-cadeaux sont un cadeau facile pour presque n’importe qui.

La blague sur cela? La différence entre les titres de ces deux articles est subtile. Voici le titre de l’article de l’IA de CNET :

Peut-on acheter une carte-cadeau avec une carte de crédit ?

Et le titre utilisé par Forbes :

Peut-on acheter des cartes-cadeaux avec une carte de crédit ?

Effectivement, la seule différence réside dans le passage du pluriel au singulier.

Un autre extrait de l’article sur les frais de découvert de l’IA de CNET est :

Qu’est-ce que la protection contre le découvert ?

La protection contre le découvert est un service facultatif proposé par les banques pour éviter le rejet d’un paiement sur un compte courant avec des fonds insuffisants.

A lire :  Républicains en Détresse : L'Usage de l'IA pour Créer des Photos Fictives de Donald Trump Sauveteur de Chats

Il semble que cette phrase soit une reformulation d’une ligne publiée par Investopedia :

Qu’est-ce que la protection contre le découvert ?

La protection contre le découvert est un service optionnel qui empêche le rejet des paiements sur un compte bancaire… dont le montant dépasse les fonds disponibles sur ce compte.

Parfois, l’IA semble également s’inspirer des rédactions de Bankrate, site associé à CNET, sans donner de crédit. Par exemple, un extrait d’un article de l’IA d’CNET évoque :

Devenir un utilisateur autorisé peut vous éviter de faire une demande de carte par vous-même, ce qui est un grand avantage si vous avez actuellement un mauvais crédit ou pas d’historique de crédit.

Et comparons cela à un exemple d’un article publié par Bankrate :

Devenir un utilisateur autorisé vous permet également d’éviter de devoir faire une demande de carte par vous-même, ce qui est un atout majeur si vous avez un mauvais crédit ou aucun historique de crédit.

Globalement, il apparaît rapidement une tendance : l’IA de CNET semble aborder un sujet en examinant des articles similaires déjà publiés, en retirant des phrases, et en effectuant quelques ajustements de syntaxe. Ce processus se répète jusqu’à ce qu’un article complet soit élaboré.

Un employé actuel de Red Ventures a également revu des exemples des travaux supposément plagiés par le bot.

« Avez-vous déjà copié vos devoirs sur quelqu’un d’autre, en lui demandant de reformuler ? » a-t-il plaisanté.

« Cela soulève la question de l’image que CNET et Bankrate souhaitent renvoyer », a-t-il ajouté. « Ils prennent ces articles et en reformulent quelques éléments. »

Êtes-vous un membre actuel ou ancien de Red Ventures et souhaitez partager votre opinion sur l’utilisation de l’IA par l’entreprise ? Écrivez-nous à tips@futurism.com. Nous pouvons garantir votre anonymat.

En somme, l’examen minutieux du travail produit par l’IA de CNET donne l’impression d’un générateur de texte rudimentaire plus qu’un système sophistiqué, produisant du contenu plagié qui pourrait conduire à un licenciement pour un reporter humain.

Il n’est pas étonnant que les problèmes d’éthique, de propriété intellectuelle et d’IA deviennent plus flous et difficiles à détecter à mesure que ces systèmes évoluent.

A lire :  L'Intelligence Artificielle d'Apple Annonce le Suicidé de Luigi Mangione

Schatten prévient par ailleurs que l’exemple de CNET est significatif, car l’IA ne semble pas puiser dans l’ensemble d’Internet pour créer de nouveau contenu, mais plutôt reprendre des phrases presque telles quelles depuis des articles existants. Les AIs plus avancées d’aujourd’hui, et celles de demain, masqueront mieux l’origine de leur matériel.

Il semble, en toute logique, que CNET et Red Ventures aient déployé leur système d’IA et aient commencé à publier ses articles sans vraiment analyser le contenu. Leurs priorités semblent viser à produire beaucoup de contenu optimisé pour un bon classement sur Google, rempli de liens d’affiliation lucratifs. Cette approche a transformé CNET en une « machine à sous optimisée par l’IA », selon The Verge.

En savoir plus sur CNET : Les spammeurs SEO sont ravis que Google ne réprime pas les articles générés par l’IA de CNET.

### FAQ

#### Qu’est-ce que le plagiat dans le contexte de l’IA ?
Le plagiat dans le contexte de l’intelligence artificielle désigne l’utilisation de contenu d’autres sources sans attribution appropriée, ce qui pourrait causer des problèmes éthiques et juridiques.

#### Comment fonctionne le processus de génération de contenu AI ?
Les systèmes de génération de contenu AI utilisent de vastes ensembles de données pour s’entraîner à produire du texte, souvent en ajustant des phrases existantes plutôt qu’en produisant du contenu totalement original.

#### Quelles sont les conséquences potentielles pour les entreprises utilisant l’IA sans supervision ?
Les entreprises peuvent faire face à des poursuites judiciaires, perdre leur réputation et engager des frais légaux importants si elles ne respectent pas les droits d’auteur et les normes éthiques.

#### L’IA pourrait-elle remplacer les journalistes à l’avenir ?
Bien que l’IA puisse générer du contenu, elle ne remplace pas entièrement le travail des journalistes humains, qui apportent une analyse critique et une perspective nécessaire aux récits.

#### Quelles mesures peuvent être prises pour éviter le plagiat IA ?
Les entreprises devraient établir des lignes directrices rigoureuses pour l’utilisation de l’IA, incluant des vérifications régulières du contenu généré et une formation appropriée pour leurs employés sur les questions de propriété intellectuelle.