Intelligence Artificielle

Google Chrome Dévoile WebMCP en Avant-Première pour les Interactions avec les Agents IA

Google Chrome Dévoile WebMCP en Avant-Première pour les Interactions avec les Agents IA
Le contenu et les recommandations de produits d’ADGO.ca sont entièrement indépendants sur le plan éditorial. Nous pouvons générer des revenus lorsque vous cliquez sur des liens vers nos partenaires.
En savoir plus

La équipe de Chrome de Google a récemment présenté une première version de **WebMCP**, une norme web proposée qui permet aux sites de dialoguer directement avec des agents d’IA via des outils structurés, évitant ainsi les désagréments liés à la capture d’écran.

Actuellement, lorsque les agents d’IA explorent des sites, ils utilisent souvent des **captures d’écran** ou du **HTML brut** pour déterminer leurs actions. Cela implique d’analyser le code, de scruter les mises en page et de faire des suppositions répétées. Ce processus s’avère souvent lent, coûteux et susceptible d’échouer lorsque la conception des pages évolue.

WebMCP, abréviation de **Web Model Context Protocol**, vise à changer cette situation.

Lors de l’annonce de cette pré-version, le développeur de Google, **André Cipriani Bandarra**, a déclaré que WebMCP “cherche à établir un chemin standard pour exposer des outils structurés, garantissant que les agents d’IA peuvent effectuer des actions plus rapidement, de manière fiable et précise.”

Au lieu de forcer un agent à interpréter des pixels ou à fouiller dans le DOM, les sites peuvent maintenant publier explicitement un **” contrat d’outils “.** Grâce à une nouvelle API navigateur, **navigator.modelContext**, un site peut définir des fonctions claires, comme **réserver un billet** ou **soumettre un formulaire**, que l’agent peut appeler directement.

“En définissant ces outils, vous indiquez aux agents comment et où interagir avec votre site, que ce soit pour réserver un vol, déposer un ticket d’assistance ou naviguer dans des données complexes. Cette voie de communication directe élimine les ambiguïtés et permet des flux de travail d’agents plus rapides et plus robustes”, a écrit Bandarra.

Pourquoi c’est important pour les développeurs et les entreprises

Les entreprises qui expérimentent avec des agents d’IA basés sur un navigateur voient souvent le coût de l’automatisation grimper très rapidement. Les approches basées sur des captures d’écran envoient des images à des modèles multimodaux, consommant de nombreux tokens. L’analyse du DOM contraint les agents à trier des balises non pertinentes avant de trouver l’élément correct.

A lire :  Le personnel d'OpenAI mécontent du nouveau logo désastreux de l'entreprise.

WebMCP propose une alternative : un seul appel à un outil structuré pourrait remplacer des **dizaines d’interactions d’interface utilisateur** fragiles. Ainsi, les équipes de développement peuvent réutiliser leur **JavaScript front-end** existant au lieu de créer et de maintenir des intégrations backend distinctes pour les agents.

En attendant, est-ce que c’est juste MCP ?

Pas tout à fait, et cette distinction est essentielle pour quiconque construit des infrastructures.

Bien que les noms soient similaires, **WebMCP** et le **Model Context Protocol (MCP)** d’Anthropic ne sont pas identiques. Le MCP d’Anthropic fonctionne sur des serveurs et connecte des plateformes d’IA à des prestataires de services via des intégrations backend. En revanche, WebMCP s’exécute entièrement côté client, dans l’onglet du navigateur.

Pour illustrer, on peut dire que le MCP est conçu pour des situations où aucun humain n’est présent. WebMCP, lui, est pour les moments où l’utilisateur est là, prêt à intervenir si nécessaire. Cela dit, les deux approches peuvent coexister et répondre à des cas d’utilisation différents.

Des débuts prometteurs avec une orientation claire

Actuellement, WebMCP se trouve derrière un drapeau “WebMCP pour test” dans **Chrome Canary**. Les développeurs doivent rejoindre le programme de prévisualisation précoce de Google pour accéder à la documentation et aux démonstrations. La spécification est en cours d’élaboration avec Microsoft et est incubée par le groupe communautaire **W3C Web Machine Learning**, témoignant des efforts pour en faire une norme web plus large.

Les observateurs de l’industrie prévoient des annonces officielles des navigateurs d’ici **mi à fin 2026**, avec des événements tels que **Google Cloud Next** et **Google I/O** comme lieux probables pour un déploiement plus large.

A lire :  Waymo Met à Jour Son Logiciel de Robotaxi Suite aux Lacunes de Navigation Révélées par la Panne à San Francisco

Avant de faire confiance à votre prochaine déploiement d’IA, lisez comment des chercheurs ont réussi à effectuer des attaques par extraction de modèle contre Google Gemini et ce que cela implique pour la sécurité des entreprises.

FAQ

Qu’est-ce que WebMCP et comment fonctionne-t-il ?

WebMCP permet une interaction directe entre les sites web et les agents d’IA en utilisant des outils structurés, facilitant ainsi les tâches sans les imprécisions des méthodes traditionnelles de capture d’écran.

Quels sont les avantages de WebMCP pour les développeurs ?

WebMCP aide les développeurs à simplifier les intégrations d’agents d’IA en remplaçant plusieurs interactions fragiles par des appels à des outils bien définis, ce qui réduit les coûts et le temps de développement.

Comment accéder à WebMCP actuellement ?

Pour utiliser WebMCP, les développeurs doivent s’inscrire au programme de prévisualisation de Google et activer le flag “WebMCP pour test” dans Chrome Canary.

WebMCP est-il compatible avec MCP d’Anthropic ?

Non, même s’ils ont des noms similaires, WebMCP fonctionne côté client tandis que MCP d’Anthropic relie les serveurs d’IA à des fournisseurs de services via des intégrations serveur.

Quand WebMCP sera-t-il largement disponible ?

Des annonces officielles concernant WebMCP sont attendues d’ici fin 2026, avec des événements comme Google Cloud Next et Google I/O comme possibles points de lancement.