Intelligence Artificielle

L’IA peut démasquer en masse des comptes pseudonymes, révèle une étude.

L'IA peut démasquer en masse des comptes pseudonymes, révèle une étude.

Depuis les débuts de l’internet, les utilisateurs ont eu la possibilité de s’exprimer librement via des comptes pseudonymes, offrant ainsi une certaine protection contre le doxxing et le harcèlement.

Cependant, l’apparition d’une intelligence artificielle avancée a rendu l’identification de ces utilisateurs pseudos bien plus facile qu’auparavant.

Un article de recherche non encore soumis à une évaluation par les pairs, élaboré par une équipe de l’ETH Zurich et de l’entreprise d’IA Anthropic, révèle que “les grands modèles linguistiques peuvent être utilisés pour effectuer une dé-anonymisation à grande échelle”.

Au cours de plusieurs études expérimentales, les chercheurs ont démontré que leur agent était capable de “réidentifier” des utilisateurs sur des forums très fréquentés tels que **Hacker News** et **Reddit**, uniquement grâce à leurs **profils et conversations en ligne anonymes**. Une tâche qui prendrait des heures à un enquêteur humain.

Les résultats étaient inquiétants : l’agent d’IA a réussi à démasquer près de **deux tiers des utilisateurs**.

Les chercheurs ont mis en garde : “Nos résultats montrent que l’obscurité pratiquée, qui protégeait les utilisateurs anonymes en ligne, n’existe plus, et les modèles de menace concernant la vie privée en ligne doivent être réévalués”.

Dans l’article, Simon Lermen, co-auteur et responsable en IA à l’ETH Zurich, a expliqué dans un billet de blog associé à l’étude que “notre méthode identifie les utilisateurs avec une précision élevée à partir de **Hacker News**, **Reddit**, **LinkedIn** et de transcriptions d’interviews anonymisées — et peut se déployer à des dizaines de milliers de candidats”.

A lire :  AI Streamer au Charme Envoûtant Perd le Nord, Nier le Holocauste

Les implications pour la **vie privée** en ligne pourraient être significatives.

“L’utilisateur moyen du net a longtemps agi sous un modèle de menace implicite où il pensait que l’anonymat offrait une protection suffisante, car une dé-anonymisation ciblée nécessiterait des efforts considérables”, ont-ils ajouté. “Les **LLM** invalident cette hypothèse.”

Lors de leurs expériences, l’équipe a collecté des ensembles de données provenant de sites de **réseaux sociaux** publics pour tester leur IA de dé-anonymisation. Ils ont établi des liens entre les publications sur Hacker News et les profils LinkedIn en utilisant des références présentes dans les profils des utilisateurs. Puis, ils ont anonymisé ces données en supprimant les références identifiables.

Ensuite, ils ont entraîné un LLM sur ces ensembles de données, en lui demandant de faire le lien entre les publications et leur auteur original.

“Nous avons découvert que ces agents IA pouvaient accomplir une tâche qui était auparavant très difficile : en partant de textes libres comme un compte-rendu d’interview anonymisé, ils peuvent retrouver l’identité complète d’une personne”, a déclaré Lermen à Ars Technica. “C’est une capacité relativement nouvelle ; les approches précédentes de réidentification nécessitaient en général des données structurées et deux ensembles de données ayant des schémas similaires pouvant être liés.”

L’équipe a dû faire preuve de prudence, car “vous ne voulez pas réellement dé-anonymiser des individus anonymes”, comme l’a expliqué Lermen dans son article. Au lieu de cela, ils ont développé “deux types de proxies de dé-anonymisation pour évaluer l’efficacité des LLM dans ces tâches.”

Même lorsque les données fournies à l’IA étaient très générales, comme des réponses à un questionnaire d’Anthropic sur l’utilisation de l’IA dans la vie quotidienne, l’LLM pouvait repérer des indices pour identifier des personnes environ **sept pour cent** du temps.

A lire :  Un homme crée des "bouchons" sur Google Maps en transportant 99 téléphones portables.

Bien que cela puisse sembler faible, Lermen a noté à Ars que c’est significatif “que l’IA puisse faire cela”.

Les chercheurs ont également constaté qu’en alimentant l’IA avec des commentaires provenant de différentes communautés cinématographiques sur Reddit, elle pouvait identifier les utilisateurs avec une précision frappante. Plus les utilisateurs discutaient de films, plus il était facile pour l’IA de les dé-anonymiser.

Cependant, ils ont souligné plusieurs limitations. D’une part, les **ensembles d’échantillons** sont “petits car ils nécessitent des liens d’identité vérifiés”, ont-ils noté.

Il est également complexe de distinguer de quoi l’LLM a tiré de sa recherche sur le net.

“L’attaque repose sur des systèmes de recherche web opaques, rendant difficile l’isolation de ce que l’agent LLM apporte par rapport à ce que les **représentations des moteurs de recherche** fournissent,” ont admis les chercheurs.

Quoi qu’il en soit, l’équipe met en garde que leurs découvertes brossent un tableau préoccupant de l’avenir de l’anonymat en ligne. “Les **LLM** démocratisent la dé-anonymisation”, ont-ils conclu, ce qui pourrait permettre aux gouvernements de “lier des comptes pseudonymes à des identités réelles pour surveiller des dissidents, des journalistes ou des militants”.

Les entreprises pourraient relier des publications apparemment anonymes sur des forums aux profils clients pour des publicités hyper-ciblées, ont-ils ajouté. “Des acteurs malveillants pourraient créer des profils sophistiqués de cibles à grande échelle pour lancer des escroqueries d’ingénierie sociale très personnalisées.”

En résumé, l’émergence de l’IA marque le début d’une nouvelle ère nécessitant des mesures de sécurité accrues, risquant d’entraîner la fin du pseudonymat en ligne.

A lire :  Elon Musk Envisage de Confisquer les iPhones pour les Stocker dans une Cage de Faraday au sein de Ses Entreprises.

“Les utilisateurs, les plateformes et les décideurs doivent comprendre que les hypothèses de vie privée qui sous-tendent une grande partie de l’internet actuel ne sont plus valables”, indique le document.

En savoir plus sur le doxxing : L’IA Grok d’Elon Musk révèle les adresses des personnes ordinaires.

FAQ

Que peut-on faire pour protéger sa vie privée en ligne ?

Il est recommandé d’utiliser des outils de cryptage, de limiter les informations personnelles partagées sur les réseaux sociaux et de considérer l’utilisation de VPN pour masquer votre IP.

Quel est le rôle des grandes entreprises dans la protection des données ?

De nombreuses entreprises collectent des données personnelles, mais les réglementations comme le RGPD en Europe les obligent à assurer une certaine protection des données de leurs utilisateurs.

Quelles sont les conséquences du doxxing ?

Le doxxing peut entraîner un harcèlement en ligne, des menaces physiques et une atteinte significative à la vie privée d’un individu.

Comment les utilisateurs peuvent-ils signaler des cas de doxxing ?

Les utilisateurs peuvent signaler les incidents de doxxing aux plateformes concernées et aux autorités compétentes pour qu’elles prennent les mesures appropriées.

Existe-t-il des lois contre le doxxing dans tous les pays ?

Non, la législation varie d’un pays à l’autre. Certains pays ont des lois strictes contre le doxxing, tandis que d’autres n’ont pas encore abordé la question légalement.