Intelligence Artificielle

Les nouveaux processeurs AI de Nvidia seraient en surchauffe dans les fermes de serveurs.

Les nouveaux processeurs AI de Nvidia seraient en surchauffe dans les fermes de serveurs.

Un retard préoccupant pour Nvidia

Nvidia rencontre des difficultés avec ses nouveaux processeurs AI Blackwell, qui ne sont pas encore disponibles sur le marché. Des clients signalent des problèmes d’échauffement de ces unités, entraînant des craintes concernant un retard supplémentaire dans les livraisons déjà décalées.

Les GPU Blackwell en surchauffe

D’après des sources internes, y compris des employés et des partenaires de Nvidia, les unités de traitement graphique (GPU) Blackwell, qui sont particulièrement puissantes, surchauffent lorsqu’elles sont installées dans des serveurs pouvant accueillir jusqu’à 72 de ces processeurs. Ce problème a incité Nvidia à demander à ses fournisseurs de reconcevoir les racks afin de résoudre la situation.

Une annonce inquiétante

Cette semaine, Nvidia a informé Microsoft d’un report des livraisons de trois mois supplémentaires, ajoutant ainsi une nouvelle couche aux retards qui affectent l’entreprise depuis la présentation des chips Blackwell en mars dernier. Ce genre de difficulté est particulièrement préoccupant dans le contexte d’une forte demande, car de nombreuses entreprises investissent massivement pour développer leurs centres de données AI.

A lire :  Royaume-Uni : un réseau 5G dopé à l’IA promet des stades sans zones mortes

Une course contre la montre

Nvidia prétend que ses GPU de nouvelle génération sont incroyablement rapides, affichant des performances jusqu’à 30 fois supérieures à celles de leurs prédécesseurs pour les applications AI. Le CEO, Jensen Huang, a récemment décrit la demande pour les processeurs Blackwell comme “insensée”, illustrant ainsi l’intérêt croissant des clients prêts à débourser des sommes considérables pour les précommander.

Des failles dans la conception

Cependant, des rumeurs concernant des défauts de conception sont apparues, pour finalement être partiellement confirmées par Huang. Lors d’une conférence de presse, il a reconnu qu’un défaut avait effectivement eu lieu, entraînant une faible productivité. Il a également affirmé que cette situation était entièrement de la responsabilité de Nvidia. Bien qu’il s’agisse d’un autre problème de production, cela a encore aggravé les délais de livraison.

La complexité des nouveaux racks

Les racks comprenant 72 GPU pèsent environ 1360 kg et nécessitent un système de refroidissement à eau, ce qui est peu commun par rapport aux systèmes de refroidissement à air habituellement utilisés. Nvidia a rencontré des difficultés même avec des configurations plus petites, notamment un rack de 36 GPU souffrant également de problèmes de surchauffe.

Actuellement, la pression monte pour Nvidia alors que l’engouement pour les nouveaux produits AI ne cesse de croître. Les clients, déjà frustrés par des retards, vont sûrement mal accueillir ces développements supplémentaires.

FAQ

H4 : Quelles sont les principales caractéristiques des GPU Blackwell ?

Les GPU Blackwell promettent d’être jusqu’à 30 fois plus rapides que les modèles précédents, spécialement optimisés pour des applications d’intelligence artificielle.

A lire :  Nouvelle gamme Echo d’Amazon : un Studio 40 % plus compact, basses triplées

H4 : Quelle est l’importance du refroidissement dans les centres de données AI ?

Le refroidissement est essentiel pour maintenir la performance et la fiabilité des serveurs, surtout lorsqu’ils fonctionnent à haute capacité. Nvidia adopte des systèmes de refroidissement à eau pour gérer l’échauffement des nouvelles unités.

H4 : Pourquoi le retard de livraison est-il un problème crucial pour Nvidia ?

Les retards peuvent nuire à la réputation de l’entreprise, augurant mal pour l’adoption de ses technologies par les clients désireux d’avancer dans le domaine de l’intelligence artificielle.

H4 : Quels impacts ces retards pourraient-ils avoir sur l’industrie de l’AI ?

Un retard prolongé dans la disponibilité des produits AI pourrait ralentir l’innovation technologique et notre capacité à développer des solutions avancées, affectant ainsi toute l’industrie.

H4 : Quelles mesures Nvidia pourrait-elle prendre pour résoudre ces problèmes ?

Nvidia pourrait renforcer la collaboration avec ses fournisseurs pour optimiser la conception et le refroidissement des nouveaux serveurs, tout en améliorant la communication avec ses clients concernant les délais de livraison.