En savoir plus
Google Cloud intensifie la compétition avec Nvidia dans l’infrastructure IA
Lors de l’événement Cloud Next 2026, Google a annoncé le lancement de deux nouvelles unités de traitement : TPU 8t pour l’entraînement et TPU 8i pour l’inférence. Ce choix de diviser ses puces d’intelligence artificielle reflète la nécessité de concevoir des solutions distinctes pour développer des modèles complexes et pour les déployer efficacement dans des environnements de production.
Les raisons de la séparation entre l’entraînement et l’inférence
D’après un aperçu de la huitième génération de TPU de Google Cloud, les TPU 8t sont optimisés pour l’entraînement, tandis que les TPU 8i sont conçus spécifiquement pour l’inférence. Les deux fonctionnent avec les processeurs Axion basés sur l’architecture Arm de Google. Cette séparation répond à un besoin croissant de distinguer le matériel requis pour former de grands modèles et celui nécessaire pour exécuter des services IA de manière efficace.
L’entraînement de modèles complexes repose sur une échelle importante, une puissance de calcul dense et une communication rapide au sein de grands clusters. L’inférence, en revanche, demande davantage d’attention sur la latence, l’utilisation de la mémoire, l’efficacité énergétique et le coût de traitement des requêtes sur le long terme.
Selon une analyse technique détaillée sur les TPU 8t et 8i, Google affirme que le TPU 8i offre jusqu’à 80 % de performance en plus par dollar et deux fois plus de performance par watt en matière d’inférence par rapport à la génération précédente. Ces chiffres, bien que révélés par Google, doivent être considérés comme des affirmations jusqu’à ce que des tests indépendants soient effectués.
Google introduit également ses chips dans un système global. Son AI Hypercomputer intègre des fonctionnalités de calcul, de mise en réseau, de stockage et de logiciels dans une infrastructure gérée, renforçant ainsi l’attractivité pour les entreprises qui souhaitent investir davantage dans les outils IA au fil du temps.
Ce que la séparation des TPU signifie pour Nvidia
Néanmoins, Google continue de collaborer avec Nvidia. Dans le cadre de sa mise à jour d’infrastructure GTC 2026, Google a annoncé son intention de proposer des systèmes Nvidia Vera Rubin NVL72 au cours de la seconde moitié de 2026.
La stratégie cloud de Google englobe désormais deux pistes : ses propres TPU pour les clients désireux de s’appuyer sur son infrastructure et les systèmes Nvidia pour ceux qui privilégient des outils GPU établis et des workflows basés sur CUDA. Pour les clients, le choix entre les deux dépendra essentiellement de la charge de travail à traiter et des coûts associés.
Les entreprises qui forment des modèles complexes se concentreront probablement sur l’échelle et l’utilisation des clusters, tandis que celles proposant des services IA à un grand nombre d’utilisateurs se soucieront plutôt des temps de réponse, de la consommation électrique et du coût par requête. Nvidia met également en avant les mêmes enjeux dans le cadre de son déploiement d’infrastructure IA, alors que Google soutient que des puces distinctes peuvent mieux s’adapter aux méthodes de construction et de mise en œuvre des systèmes IA.
La question de savoir si cette approche entraînera une adoption plus large dépendra des retours des clients après le lancement. Les prix, les performances et les éventuelles difficultés logicielles joueront un rôle crucial une fois que ces systèmes seront opérationnels.
Pour l’instant, Google présente les TPU 8t et 8i comme une alternative plus spécialisée à une solution à puce unique, tout en constituant une menace directe pour Nvidia sur le terrain de l’infrastructure IA dans le cloud.
Informations supplémentaires
Qu’est-ce que le TPU 8t et TPU 8i de Google Cloud ?
Le TPU 8t est optimisé pour l’entraînement de modèles IA, tandis que le TPU 8i se concentre sur l’inférence, ce qui permet d’optimiser les performances de chaque phase du traitement.
Pourquoi Google Cloud investit-il dans des puces personnalisées ?
L’investissement dans des puces personnalisées permet de répondre précisément aux besoins des entreprises, favorisant ainsi des solutions plus efficaces et adaptées aux exigences du marché.
Quel impact cette séparation des TPU aura-t-elle sur les entreprises ?
Cette séparation pourrait permettre aux entreprises de choisir la solution la plus adaptée à leurs besoins spécifiques, favorisant ainsi des performances optimales en fonction de leur charge de travail.
Y a-t-il des risques liés à la dépendance accrue vis-à-vis de matériel spécialisé ?
Oui, une dépendance accrue à des matériels spécifiques pourrait entraîner des risques en matière de flexibilité et de coûts à long terme, surtout si le marché évolue rapidement.
Comment Google se positionne-t-il par rapport à ses concurrents ?
Google se positionne comme un acteur innovant qui propose des solutions IA avancées, tout en continuant de collaborer avec des leaders du secteur comme Nvidia pour offrir une large gamme d’options aux entreprises.
