Avant même que Jensen Huang ne prenne la parole lors de la conférence GTC 2026, Nvidia avait déjà créé l’événement avec des éléments symboliques tels que sa veste en cuir et une vision d’avenir, laissant présager une annonce majeure.
Un leader incontournable dans l’IA
Huang n’est plus seulement un PDG régnant sur le secteur de l’intelligence artificielle, mais il est devenu une figure centrale, un leader technologique rare dont les interventions sur scène ressemblent davantage à des prévisions sectorielles qu’à des lancements de produits.
Cette année, la présentation principale a marqué un tournant. Nvidia a présenté le GTC comme un parcours à travers l’« intégralité de l’IA », englobant tout, depuis les puces et l’infrastructure jusqu’aux modèles, systèmes agentiques et AI physique.
La question cruciale n’était pas tant de savoir quel produit Huang allait dévoiler, mais plutôt quelle partie de la future économie de l’IA Nvidia cherchait à contrôler.
Tous les aspects de l’IA
La réponse générale fut : tout.
GTC 2026 a été marquée par l’idée que Nvidia veut dominer non seulement la formation, mais aussi l’économie de l’inférence et l’infrastructure associée aux systèmes d’IA. Ses annonces matérielles les plus significatives vont dans cette direction.
Nvidia a élargi la plateforme Vera Rubin avec un rack d’inférence basé sur Groq, nommé NVIDIA Groq 3 LPX, tout en ajoutant un rack de CPU Vera, un rack de stockage BlueField-4, et un rack de réseau Spectrum-6. L’idée est que ces systèmes collaborent comme un supercalculateur d’IA, englobant la pré-formation, la post-formation, l’évolutivité lors de tests et l’inférence agentique en temps réel.
Ce choix de Groq est particulièrement révélateur. Nvidia continue de promouvoir le GPU comme son principal atout, mais montre aussi une ouverture à intégrer des architectures externes pour surmonter les nouveaux obstacles.
Des avancées impressionnantes
Selon les rapports de CRN, le Groq 3 LPX, associé à Vera Rubin NVL72, peut augmenter le débit d’un modèle GPT de 1 trillion de paramètres par un facteur de 35, comparé à la génération précédente, le Blackwell NVL72. Même en tenant compte d’un certain enthousiasme lors de la présentation, la stratégie est claire : Nvidia cherche à transformer l’inférence d’un centre de coût pénible en un véritable moteur de revenus optimisé.
Cette transition est cruciale, car le marché de l’IA évolue. La formation a constitué le fondement de cette croissance, mais l’inférence devient la véritable source de profits, surtout à mesure que les modèles passent plus de temps à raisonner, à utiliser davantage d’outils et à fonctionner davantage comme des travailleurs logiciels que comme de simples chatbots. Nvidia s’exprime de plus en plus en ce sens.
Un écosystème intégré
L’année précédente, Nvidia a lancé Dynamo, un logiciel d’inférence en open-source destiné à améliorer le débit et à réduire les coûts liés aux charges de travail de raisonnement. Cette année, la présentation s’est étendue à l’idée d’intégrer directement cette logique au niveau des racks eux-mêmes. L’inférence est devenue plus qu’un simple effet secondaire de l’IA ; elle commence à se transformer en cœur du business.
D’autres éléments de la plateforme Rubin confirment cette tendance. Nvidia a communiqué que le NVL72 combine 72 GPUs Rubin et 36 CPUs Vera sur mesure, tout en intégrant de nouvelles fonctionnalités comme le calcul confidentiel à l’échelle des racks, la maintenance sans temps d’arrêt et une plateforme de stockage de « mémoire contextuelle » conçue pour alimenter de grands systèmes d’IA avec des données.
Un changement de paradigme
Ce sont ces éléments qui indiquent un changement plus profond dans les coulisses. Nvidia ne se contente plus de vendre des puces pour l’infrastructure IA. L’entreprise aspire à définir cette infrastructure comme un ensemble intégré comprenant le calcul, le réseau, le stockage, l’orchestration et la sécurité, un défi que peu d’entreprises peuvent réellement relever.
Le charisme de Huang
Cette stratégie est également renforcée par le charisme d’Huang. Son image de leader lui permet de rendre la complexité de l’industrie cohérente pour le public. Dans un marché aussi vaste, cette cohérence devient un produit en soi.
Les résultats financiers de Nvidia aident à justifier cet optimisme. Huang a prédit que les processeurs d’IA phares de l’entreprise aideraient à générer 1 trillion de dollars de ventes d’ici 2027, un chiffre qui, bien qu’impressionnant, semble moins farfelu quand on se rappelle que l’entreprise a récemment annoncé un chiffre d’affaires de 215,9 milliards de dollars pour l’exercice 2026.
L’IA comme infrastructure industrielle
Il existe une autre dimension à cette évolution, qui fait que le GTC ne ressemble plus à une simple conférence pour développeurs, mais plutôt à une foire d’État pour l’ère industrielle de l’IA.
Nvidia affirme que plus de 30 000 personnes de 190 pays sont présentes à GTC cette année, et l’entreprise a consacré des mois à présenter l’IA comme une infrastructure essentielle. Cela change la dynamique des discussions, passant de la question « quel modèle a gagné cette semaine ? » à une affirmation plus vaste et plus lucrative : l’IA devient un développement industriel à long terme, intégrant l’énergie, les usines, les réseaux et les systèmes logiciels qui soutiennent l’ensemble de l’écosystème technologique.
Huang est désormais un symbole puissant. Steve Jobs a donné un aspect magique à la technologie destinée aux consommateurs, tandis que Huang rend la technologie industrielle inévitable. Au lieu de vendre un futur en forme de téléphone, il propose un futur orienté vers l’économie.
Cette vision s’est intensifiée chez Nvidia. L’entreprise a investi des milliards pour renforcer sa capacité optique avec Lumentum et a collaboré avec Nebius pour développer une infrastructure cloud AI à l’échelle des gigawatts. Elle a également élargi ses partenariats industriels avec des entreprises comme Siemens et Dassault Systèmes pour avancer dans l’IA au sein des systèmes manufacturiers et de conception.
Vers une intégration totale
Ce développement peut se voir comme une diversification, mais cela peut aussi s’interpréter comme un moyen de conserver son empire. Cela démontre que le cadre de celebrity CEO n’est pas superficiel ; Huang joue un rôle crucial comme narrateur d’une stratégie d’entreprise vaste et complexe. Comment convaincre le marché que les puces, les usines, l’énergie, le logiciel d’inférence, la robotique et les jumeaux numériques industriels font tous partie d’une même narration ? En plaçant un homme sur scène pour en faire une histoire incontournable.
C’est peut-être le message le plus important à retenir du GTC 2026. Nvidia ne cherche pas seulement à tirer parti de l’essor des modèles. L’entreprise souhaite s’imposer en tant que couche opérationnelle dans l’économie de l’IA agentique — couvrant tous les aspects, de la formation à l’inférence, jusqu’au stockage, à la sécurité et au déploiement physique. Le charisme d’Huang constitue le revêtement culturel de cette stratégie.
La veste en cuir capte l’attention, mais c’est la pile technologique qui la maintient.
FAQ
Quels produits spécifiques a-t-on vu lors de GTC 2026 ?
Nvidia a présenté plusieurs nouveaux racks d’inférence, dont le NVIDIA Groq 3 LPX et le rack de stockage BlueField-4.
Pourquoi l’inférence est-elle si importante pour Nvidia ?
L’inférence représente la partie du processus d’IA où se génèrent les profits, devenant cruciale alors que les modèles deviennent plus complexes.
Comment Nvidia se positionne-t-elle par rapport à ses concurrents ?
Nvidia cherche non seulement à vendre des composants matériels, mais aussi à définir l’infrastructure IA intégrée, un défi que peu de concurrents peuvent relever.
Quelles sont les implications de l’investissement de Nvidia dans l’optique et les collaborations industrielles ?
Ces investissements permettent à Nvidia de se positionner comme un leader non seulement dans l’IA, mais aussi au sein d’une infrastructure industrielle plus large.
Comment Huang influence-t-il la perception d’Nvidia ?
Sa présence sur scène et son charisme aident à rendre la stratégie complexe d’Nvidia accessible et cohérente pour le marché.
