En savoir plus
Un tournant majeur dans le monde de l’IA
Hier, le monde de l’intelligence artificielle (IA) a connu deux lancements majeurs presque simultanés. Pour ceux d’entre vous qui travaillent dans le codage avec une approche proactive, vos outils viennent de bénéficier d’une mise à jour significative. Attention toutefois : vos limites de taux pourraient être atteintes plus rapidement.
Voici ce qui s’est passé
-
Anthropic a lancé Claude Opus 4.7, qui conserve la même structure tarifaire que la version 4.6, à savoir 5 $ / 25 $ par million de tokens.
-
Les capacités de raisonnement visuel de l’IA ont grimpé de 69,1 % à 82,1 %, avec un traitement d’image atteignant jusqu’à 2 576 pixels sur le bord long, soit plus de trois fois la performance des précédents modèles Claude.
-
Le SWE-bench Pro, une référence de codage, a vu son score passer de 53,4 % à 64,3 %. De plus, la version 4.7 est désormais numéro 1 sur le Vibe Code Benchmark de Vals AI avec un score de 71 %.
-
Le hic mentionné dans les documents d’Anthropic : le nouveau tokenizer peut consommer jusqu’à 35 % de tokens supplémentaires pour le même texte. En raison du niveau d’effort par défaut « xhigh-effort » de Claude Code, les utilisateurs de Pro et de Max risquent d’atteindre leurs plafonds hebdomadaires plus rapidement à moins de réduire manuellement cette valeur.
Quelques heures après la sortie d’Anthropic…
OpenAI a revu Codex, son application de codage, pour en faire “Codex pour (presque) tout”, une sorte de version d’OpenAI de Claude Cowork. Ce nouvel outil inclut des fonctionnalités de type Mac (où les agents interagissent avec vous), un navigateur intégré, une mémoire persistante, des automatisations fonctionnant sur plusieurs jours, ainsi que plus de 90 nouveaux plugins (comme Atlassian Rovo, CircleCI, Microsoft Suite, etc.). Ce n’est que le début de ses capacités.
Évolution du paysage SaaS
Un fait marquant dans la compétition des logiciels : Mike Krieger, CPO d’Anthropic, a quitté le conseil d’administration de Figma le jour même où des rumeurs ont circulé sur le lancement d’un logiciel de design par Anthropic. Résultat? L’action de Figma a chuté, avec des rumeurs selon lesquelles le lancement était prévu pour hier… mais cela ne s’est pas concrétisé.
Conseils d’experts de l’équipe Claude Code
-
Préparez votre contexte. Indiquez clairement vos objectifs, vos contraintes et vos critères d’acceptation dès le premier tour. Claude Opus 4.7 est capable d’interpréter un briefing complet ; si vous fournissez seulement un objectif vague, vous obtiendrez des résultats similaires à ceux de la version 4.6.
-
Activez le mode automatique. Cliquez sur Shift+Tab dans le terminal (Max, Team, Enterprise) pour que vos autorisations soient classées par un filtre de sécurité. Cela vous permettra d’exécuter plusieurs instances de Claude en parallèle, rendant vos tâches plus efficaces.
-
Indiquez comment vérifier son propre travail. Cela peut multiplier la qualité de la sortie par deux à trois fois. Intégrez votre flux de test dans votre fichier claude.md pour que 4.7 exécute des tests à chaque utilisation ou envisagez d’installer une compétence d’application /verify-app pour votre environnement.
-
xhigh est désormais le nouveau paramètre par défaut pour Claude Code. Utilisez /effort pour simplifier les tâches courantes et réservez le niveau maximal pour les tâches les plus complexes (ce paramètre ne persiste pas au-delà de la session actuelle).
Dans l’application web, une nouvelle fonctionnalité, la pensée adaptative, permet à Claude de déterminer combien de temps il doit réfléchir. Autrement dit, c’est comme un routeur de réflexion. Il faudra un peu de temps pour s’adapter à cette innovation, mais il est essentiel de l’utiliser, car sans cela, ses capacités de réflexion seront limitées.
Notre avis
Il semble que le véritable enjeu réside dans le tokenizer. Bien qu’Anthropic annonce que le prix est identique à la version 4.6, en réalité, le même prompt utilise plus de tokens, le niveau d’effort par défaut est supérieur et les sorties sont plus longues. Un de nos contacts a atteint sa limite maximale hebdomadaire avec pratiquement un seul prompt.
Cela dit, Opus 4.7 est indéniablement un meilleur modèle. Son coût est également plus élevé, même si les tarifs affichés restent inchangés. Les utilisateurs qui en tireront le meilleur parti ne seront pas ceux qui travaillent avec les réglages par défaut, mais ceux qui appliquent effectivement ces meilleures pratiques. Prenez le temps de vous informer.
Remarque de l’éditeur : Ce contenu a été initialement publié dans la newsletter de notre publication sœur, The Neuron. Pour lire davantage d’articles de The Neuron, abonnez-vous à sa newsletter ici.
FAQ
Quelle est la différence entre Claude Opus 4.6 et 4.7 ?
Claude Opus 4.7 offre des améliorations significatives en termes de performance, notamment en raison d’une meilleure capacité de raisonnement visuel et d’un tokenizer plus efficace.
Les modifications tarifaires affectent-elles tous les utilisateurs ?
Non, bien que le prix de base reste le même, la nouvelle version peut utiliser davantage de tokens, ce qui pourrait entraîner des coûts supplémentaires pour les utilisateurs fréquents.
Existe-t-il des fonctionnalités spécifiques au nouveau Codex d’OpenAI ?
Oui, Codex intègre de nouvelles fonctionnalités telles qu’un navigateur intégré et des automatisations améliorées, optimisant ainsi l’expérience utilisateur.
Comment puis-je obtenir de meilleures performances de la part de Claude Opus 4.7 ?
En suivant les meilleurs pratiques énoncées par les experts, notamment en fournissant un contexte clair et en activant le mode automatique pour les tâches répétitives, vous pouvez maximiser les performances.
Quelles sont les implications du départ de Mike Krieger de Figma ?
Son départ suggère une compétition accrue dans le domaine des logiciels de design, ce qui pourrait influencer le marché et la perception des actions de Figma.
