Imaginez un instant que vous écoutez une vidéo YouTube en arrière-plan, ou même un podcast. À votre insu, des hackers ont intégré des sons inaudibles qui peuvent manipuler l’assistant numérique de votre smartphone ou de votre enceinte connectée. Cela signifie qu’ils pourraient accéder à des informations privées telles que des photos, des comptes bancaires, ou tout autre élément sensible lié à votre système d’intelligence artificielle.
Cela semble tiré d’un épisode de “Black Mirror”, mais c’est précisément ce que des chercheurs ont démontré dans des travaux récents, présentés cette semaine lors du Symposium IEEE sur la Sécurité et la Vie Privée.
Une équipe de chercheurs, provenant de Chine et de Singapour, a révélé qu’il était possible de créer des **”audio adversariaux”**, indétectables à l’oreille humaine, qui trompent les modèles d’IA vocale. Ces sons malveillants peuvent facilement être intégrés dans des fichiers audio apparemment innocents — que ce soit une musique, un film, ou n’importe quel autre fond sonore — attendant que les utilisateurs compromettent accidentellement leur vie numérique.
Meng Chen, le principal auteur et doctorant à l’Université Zhejiang en Chine, a déclaré : « Il suffit de trente minutes pour entraîner ce signal. Étant donné que ce signal est indépendant du contexte, vous pouvez l’utiliser pour attaquer le modèle cible à tout moment, peu importe ce que l’utilisateur dit. » Il a ajouté que « ces défenses uniques ont du mal à résister à notre attaque, car il est très difficile pour ces modèles de distinguer l’intention normale de l’utilisateur de notre attaque. »
Cependant, il y a une condition à ce jour : les hackers devaient avoir accès aux poids complets du modèle d’IA qu’ils ciblaient, d’où leur capacité à attaquer uniquement des modèles open source. Et étant donné que de nombreux systèmes d’IA commerciaux reposent sur des modèles open source, leur méthode s’est révélée efficace contre des produits grand public de Microsoft et Mistral.
Mistral n’a pas répondu à la demande de commentaire d’**IEEE**, mais Microsoft a publié une déclaration à propos de cette découverte, que quiconque utilisant un de leurs modèles d’IA vocale devrait considérer attentivement.
La déclaration note : « Nous apprécions le travail des chercheurs pour faire progresser la compréhension de ce type de technique. Cette étude évalue la résilience des modèles à travers des interactions directes contrôlées, ce qui nous aide dans notre démarche pour renforcer la résilience des modèles. En pratique, les modèles d’IA sont souvent intégrés dans des applications utilisateur, et nous fournissons aux développeurs des outils et des conseils qu’ils peuvent utiliser pour mettre en œuvre des couches de protection supplémentaires pour sécuriser les utilisateurs. »
Pour en savoir plus sur l’IA : Des chercheurs s’inquiètent de l’IA pouvant se dupliquer sur une autre machine.
FAQ
Qu’est-ce qu’un audio adversarial ?
Un audio adversarial est un son spécialement conçu pour tromper les modèles d’intelligence artificielle, souvent inaudible pour l’oreille humaine. Ces sons peuvent manipuler les assistants numériques.
Comment ces attaques peuvent-elles affecter les utilisateurs ?
Ces attaques peuvent compromettre la sécurité personnelle des utilisateurs, en donnant accès à des informations privées telles que des photos ou des données bancaires.
Les systèmes commerciaux sont-ils en sécurité contre ces attaques ?
Bien que les attaques soient principalement efficaces contre les modèles open source, de nombreux systèmes commerciaux reposent sur ces modèles, ce qui les rend vulnérables.
Que peuvent faire les utilisateurs pour se protéger ?
Les utilisateurs peuvent prendre des mesures de sécurité, telles que l’utilisation d’applications solidement sécurisées, la mise à jour régulière de leur logiciel et la méfiance face aux sources audio inconnues.
Quelles recherches supplémentaires sont en cours sur ce sujet ?
Les chercheurs continuent d’explorer des techniques de défense pour renforcer la sécurité des systèmes d’IA et prévenir de telles attaques.
