Grave vulnérabilité découverte dans le nouveau navigateur IA d’OpenAI

Facebook X

Des spécialistes de la cybersécurité alertent déjà sur des failles sérieuses touchant le nouveau navigateur Atlas d’OpenAI, pensé pour placer ChatGPT au cœur de la navigation et automatiser des tâches en ligne. Au-delà des attaques déjà connues via des pages web piégées, une nouvelle faiblesse met en cause la façon dont Atlas interprète ce que l’utilisateur saisit dans sa barre de saisie.

Sommaire

Ce que propose Atlas et pourquoi cela inquiète

Atlas offre un mode agent (réservé aux abonnés) capable d’exécuter des actions complètes: réserver un billet d’avion, remplir un panier de courses, ou encore parcourir des documents. Cette promesse d’assistance clé en main est puissante, mais elle élargit la surface d’attaque: si l’agent se trompe sur l’intention de l’utilisateur ou suit des consignes malicieuses, il peut enchaîner des actions non souhaitées, parfois sur des comptes déjà authentifiés dans le navigateur.

De l’injection sur page… à l’injection via la barre de saisie

Jusqu’ici, les démonstrations d’attaque visaient surtout des consignes cachées dans des pages web, connues sous le nom de prompt injection indirecte. Des chercheurs ont montré qu’on peut détourner la sortie de l’agent (par exemple, au lieu de résumer un document, il affiche un slogan imposé).

A lire : Le Nest Learning Thermostat de Google atteint son plus bas historique: 210 $

Des travaux de la société de sécurité des agents IA NeuralTrust vont plus loin: ils indiquent que l’Omnibox d’Atlas — ce champ situé en haut du navigateur, qui accepte à la fois des URL et des requêtes en langage naturel — interprète trop généreusement ce qu’on y colle. En substance, un texte qui ressemble à une URL mais n’est pas parfaitement conforme peut ne pas être traité comme une adresse web; Atlas le considère alors comme une instruction utilisateur hautement fiable. Résultat: des consignes malveillantes peuvent se glisser dans ce qui paraît être un simple lien.

Pourquoi c’est problématique

L’Omnibox fait office d’interface de confiance: ce qui y est saisi passe pour l’intention de l’utilisateur, avec moins de garde-fous.
L’agent peut alors suivre des directives injectées qui contredisent la demande réelle ou contournent certaines politiques de sécurité.
Si l’utilisateur est déjà connecté à des services (par exemple un drive ou une messagerie), l’agent pourrait, dans des scénarios extrêmes, effectuer des actions irréversibles comme des suppressions massives ou des transferts non désirés.

Autrement dit, une entrée banale devient un cheval de Troie: derrière une chaîne de caractères anodine, l’agent reçoit des ordres et les exécute avec un niveau de confiance élevé.

Ce que recommandent les chercheurs

Les équipes de NeuralTrust appellent à durcir l’analyse des URL:

En cas de moindre ambiguïté, Atlas devrait refuser de naviguer et ne pas basculer automatiquement en “mode requête”.
L’agent devrait appliquer davantage de contrôles lorsqu’il lit des instructions issues de l’Omnibox.
Des confirmations claires devraient être exigées avant toute action sensible (accès à des comptes, modifications de fichiers, transactions, etc.).

A lire : OpenAI Annonce l'Analyse des Conversations de ChatGPT et le Signalement aux Autorités

Ces principes réduisent la surface de manipulation liée à l’interprétation de l’intention et rétablissent un filet de sécurité entre entrée utilisateur et action automatisée.

Un risque partagé par les navigateurs IA

Le problème ne touche pas qu’Atlas. La société Brave a récemment rappelé que les navigateurs alimentés par l’IA (y compris des alternatives comme le navigateur Comet de Perplexity) sont exposés aux injections indirectes: un simple résumé d’une page publique pourrait, si l’utilisateur est connecté à des comptes sensibles, conduire à des fuites de données ou à des opérations indésirables. Le cœur du risque: un agent qui exécute des consignes qu’il n’aurait jamais dû considérer comme fiables.

La position d’OpenAI

Le responsable de la sécurité de l’information d’OpenAI a reconnu publiquement que la prompt injection reste un problème de sécurité non résolu et en constante évolution, face à des adversaires prêts à investir pour tromper les agents. À la date évoquée par les médias spécialisés, OpenAI n’avait pas répondu aux sollicitations concernant les découvertes de NeuralTrust.

À retenir

Atlas mise sur un agent puissant, mais la manière dont il comprend les instructions ouvre la porte à des abus.
L’Omnibox peut interpréter certains textes comme des requêtes de confiance, même lorsqu’ils ressemblent à des URL, créant un vecteur d’attaque.
Les chercheurs recommandent de renforcer la validation des entrées et de bloquer tout comportement ambigu.
Le phénomène concerne l’ensemble de la catégorie des navigateurs IA: la vigilance et les garde-fous doivent progresser au même rythme que les capacités.

FAQ

Qu’est-ce qu’une “prompt injection” ?

C’est une technique qui consiste à glisser des consignes cachées à destination d’un agent IA afin d’influencer son comportement. Ces consignes peuvent être dissimulées dans une page web, un document, ou même dans ce que l’utilisateur colle dans la barre de saisie.

A lire : Comment tromper ChatGPT : L'art de l'absurde

Comment puis-je me protéger au quotidien ?

Évitez de coller des chaînes suspectes dans l’Omnibox.
Déconnectez-vous des comptes sensibles lorsque vous explorez des sites inconnus.
Activez les confirmations d’action quand elles existent et refusez toute opération inattendue.
Mettez à jour votre navigateur dès qu’un correctif est disponible.

Les entreprises doivent-elles limiter l’usage de ces navigateurs ?

Pour les postes à privilèges élevés ou manipulant des données sensibles, il est prudent d’appliquer des politiques: comptes séparés, sessions isolées, restrictions d’accès et validations manuelles pour les actions à risque.

Est-ce un problème de conception ou de réglage ?

C’est souvent un mélange des deux: l’ergonomie qui unifie recherche, URL et requêtes en langage naturel est pratique, mais impose des règles de parsing strictes et des garde-fous adaptés pour éviter les interprétations dangereuses.

Comment reconnaître une URL “piégée” ?

Il n’existe pas de signe infaillible à l’œil nu. Méfiez-vous des liens ou “pseudo-liens” reçus de sources inconnues, des chaînes inhabituellement longues ou truffées d’éléments non familiers, et privilégiez la navigation vers des sites que vous saisissez vous-même ou que vous sélectionnez depuis des favoris vérifiés.

Grave vulnérabilité découverte dans le nouveau navigateur IA d’OpenAI

Ce que propose Atlas et pourquoi cela inquiète

De l’injection sur page… à l’injection via la barre de saisie

Pourquoi c’est problématique

Ce que recommandent les chercheurs

Un risque partagé par les navigateurs IA

La position d’OpenAI

À retenir

FAQ

Qu’est-ce qu’une “prompt injection” ?

Comment puis-je me protéger au quotidien ?

Les entreprises doivent-elles limiter l’usage de ces navigateurs ?

Est-ce un problème de conception ou de réglage ?

Comment reconnaître une URL “piégée” ?

Share This Post:

Cela peut vous intéresser

La Cour Suprême Inflige un Coup Dur aux « Artistes IA »

La Véritable Raison de l’Arrêt de Sora par OpenAI : Un Avertissement pour Toutes les Startups en IA

Pression des Lobbyistes AI : Les Démocrates Face à un Dilemme Avec les Électeurs

Les Conséquences Potentielles d’un Échec Juridique pour OpenAI