Inscription à la Newsletter
Restez à jour sur l’avenir
Recevez des informations incontournables sur les dernières innovations qui émergent à la frontière de la science et de la technologie.
DarkBERT, une nouvelle approche
OpenAI a formé des modèles de langage à partir d’un large éventail de données, en puisant dans les recoins les plus obscurs de l’Internet. Imaginez maintenant un modèle capable de naviguer dans le dark web, cette partie de l’Internet où l’anonymat prédomine. Des chercheurs sud-coréens ont développé un modèle d’IA appelé DarkBERT, destiné à indexer certains des sites les plus douteux du web.
Ce modèle offre un aperçu fascinant des recoins les plus troubles du World Wide Web, célèbres pour les activités illégales et malveillantes, allant du partage de données volées à la vente de drogues dures. Bien que cela puisse sembler inquiétant, les chercheurs affirment que DarkBERT a une mission philanthropique : éclairer de nouvelles méthodes pour lutter contre la cybercriminalité, en utilisant de plus en plus le traitement du langage naturel.
Lutte contre la cybercriminalité
Comprendre les parties du web non accessibles par des moteurs de recherche comme Google est un défi majeur. Les chercheurs, selon un article qui n’a pas encore été examiné par des pairs, ont branché leur modèle sur le réseau Tor, un système permettant d’accéder au dark web, et ont commencé à recueillir des données brutes.
Leurs résultats montrent que ce nouveau modèle de langage s’avère bien plus efficace pour déchiffrer le dark web que d’autres modèles, y compris un modèle appelé RoBERTa développé par des chercheurs de Facebook en 2019. Selon les chercheurs, les résultats de leur évaluation prouvent que le modèle de classification basé sur DarkBERT surpasse ceux des modèles de langage pré-entraînés connus.
Les spécialistes estiment que DarkBERT pourrait avoir de nombreuses applications dans le domaine de la sécurité informatique. Il pourrait, par exemple, être utilisé pour identifier des sites diffusant des rançongiciels ou divulguant des informations confidentielles. Par ailleurs, il pourrait également surveiller les forums du dark web, actualisés quotidiennement, pour repérer tout échange d’informations illicites.
Cependant, beaucoup se demandent si, même si ce système fonctionne, nous avons réellement envie de laisser l’IA surveiller l’Internet à notre place.
FAQ
Qu’est-ce que le dark web ?
Le dark web désigne une partie de l’Internet accessible uniquement via des logiciels spécialisés, et où l’anonymat des utilisateurs est préservé. Il est souvent associé à des activités illégales.
Comment DarkBERT collecte-t-il des données ?
DarkBERT se connecte au réseau Tor pour accéder à des sites du dark web et compile des données qu’il trouve afin de créer une base de données exploitable pour les analyses.
Quels sont les risques liés à l’utilisation de modèles comme DarkBERT ?
L’utilisation de tels modèles peut soulever des questions éthiques et juridiques. Cela pose également le problème de savoir si nous devrions permettre à des IA de surveiller et réguler notre usage d’Internet.
Les modèles de traitement du langage naturel peuvent-ils aider à la cybercriminalité ?
Oui, comme l’indiquent les chercheurs, ces modèles peuvent être utilisés pour détecter des comportements criminels en ligne, ce qui pourrait faciliter la lutte contre des crimes numériques.
Quel est l’avenir de la lutte contre la cybercriminalité grâce à l’IA ?
Avec l’évolution des technologies d’IA, il est probable que de nouveaux outils et méthodes émergeront, améliorant la capacité à identifier et prévenir la cybercriminalité.
