Une phrase souvent entendue dans le milieu journalistique est : “ne lisez jamais les commentaires”. Les sections de commentaires, qu’il s’agisse de Twitter, Reddit ou d’autres plateformes, sont souvent considérées comme des lieux particulièrement sombres du web. C’est là que les insultes sans fondement et les critiques acerbes fusent comme des projectiles dans un tumulte chaotique.
Pour nous prémunir de cette laideur, tant celle des autres que la nôtre, des ingénieurs d’IBM ont conçu un **algorithme d’intelligence artificielle**. Cet outil vise à filtrer les grossièretés dans nos messages et à proposer des alternatives plus acceptables.
Les scientifiques qui ont développé cet algorithme de filtrage de la vulgarité sont conscients, dans une tournure rafraîchissante, des abus possibles de leur outil. Des **gouvernements autoritaires** ou des entreprises technologiques intrusives pourraient potentiellement utiliser des algorithmes similaires pour censurer des discours critiques ou politiques dans les échanges en ligne. Étant donné que certaines autorités ferment déjà les yeux sur des voix dissidentes, il est raisonnable de penser qu’un tel outil pourrait s’avérer destructeur s’il tombait entre de mauvaises mains.
Plutôt que de simplement modifier les propos offensants, les chercheurs soutiennent que leur algorithme devrait offrir des **rappels doux** et des suggestions. Par exemple, un outil similaire à l’ancêtre de Microsoft, *Clippy*, pourrait surgir pour demander : « Voulez-vous *vraiment* dire à cet inconnu sur Reddit de se faire voir ? » au lieu de corriger automatiquement ce que vous tapez.
Cette approche a du sens. Elle pourrait être comparée à l’acte de laisser passer sa colère avant de prendre une décision ou de s’éloigner du clavier avant d’appuyer sur “envoyer”.
Formé sur des millions de tweets et de publications Reddit, ce système d’IA a montré une grande efficacité dans l’élimination des mots vulgaires et haineux. Toutefois, il est beaucoup moins performant pour reformuler les phrases de manière courtoise tout en préservant leur sens.
Par exemple, un tweet comme « bros before hoes » a été transformé en « bros before money ». Il manque quelque chose, n’est-ce pas ? Bien que cela soit supérieur aux performances d’autres algorithmes de filtrage, celui-ci a converti le même tweet en « club demain ». On peut reconnaître un progrès, après tout.
De plus, de nombreux jurons ont été remplacés par « grand » sans tenir compte du contexte. Ainsi, un post frustré sur Reddit, disant « Quel putain de cirque ! » s’est mué en un « quel grand cirque ! », plein de respect.
Jusqu’à présent, les chercheurs ont développé leur algorithme sans l’intégrer dans un outil en ligne accessible, que ce soit pour des utilisateurs individuels ou pour les sites web eux-mêmes. Pour que cela se produise, il faudra que l’algorithme s’améliore considérablement dans ses suggestions de langage.
Malgré les limitations évidentes, l’équipe derrière cet algorithme est consciente de ses faiblesses. Les filtres d’IA de ce type ne peuvent généralement que cibler les formes les plus explicites d’abus en ligne. Par exemple, il ne peut pas détecter si une phrase particulière est haineuse, à moins qu’elle n’inclue des termes spécifiques et émotionnels. Si le langage est apparemment inoffensif ou nécessite un contexte pour être compris, il passera inaperçu.
Les préjugés implicites pourraient alors rester sans contrôle, tant que personne ne prononce « merde ». Cela ne tient pas compte des formes d’harcèlement en ligne, telles que le **harcèlement, le doxxing** ou les menaces, qui sont peut-être des problématiques encore plus dangereuses. Bien qu’un filtre de langage ne puisse pas mettre fin à la culture toxique d’internet, cette recherche en IA pourrait nous aider à prendre du recul et à réfléchir sérieusement avant de perpétuer des discours haineux.
FAQ
Qu’est-ce qu’un algorithme de filtrage de vulgarités ?
Un algorithme de filtrage de vulgarités est un programme informatique qui analyse des textes pour détecter et remplacer des mots ou phrases jugés offensants.
Pourquoi est-il important de filtrer les commentaires en ligne ?
Filtrer les commentaires peut aider à créer un environnement en ligne plus respectueux, réduisant ainsi la propagation d’intimidation et de discours haineux.
Comment cet algorithme traite-t-il les commentaires ambigus ?
L’algorithme a des difficultés avec le langage ambigu ou contextuel, car il se concentre principalement sur les termes explicitement offensants.
Existe-t-il des moyens alternatifs de gérer les discours haineux en ligne ?
Oui, des méthodes telles que la modération humaine et la sensibilisation à la communication respectueuse peuvent également contribuer à réduire les discours haineux.
Quel est l’avenir de ces technologies de filtrage ?
À mesure que l’IA évolue, il est probable que de tels algorithmes deviendront plus sophistiqués, capables de comprendre de meilleures nuances dans le langage et de répondre de manière plus efficace.
