Toute la veille
Compute

Google plafonne l'accès de Meta à Gemini et paie 920 millions de dollars par mois à SpaceX pour 110 000 GPU Nvidia

Faute de puissance de calcul, Google a limité l'usage que Meta fait de ses modèles Gemini et signé un accord à 920 millions de dollars mensuels avec SpaceX pour louer 110 000 GPU Nvidia. Ce que révèle la pénurie de calcul.

COMPUTE
L'actu décodée Source · Presse économique

L’information a de quoi surprendre. Google, l’une des entreprises qui possède le plus de centres de données au monde, manque de puissance de calcul au point de rationner l’accès de ses propres clients à ses modèles d’IA.

Google a plafonné l’utilisation que Meta fait de Gemini, sa famille de modèles d’intelligence artificielle. Meta, comme beaucoup d’entreprises, achète de la capacité d’IA à Google via son offre cloud. Et Google a posé une limite, en invoquant directement un manque de puissance de calcul disponible. Le fournisseur n’a pas assez de machines pour servir tous ceux qui veulent en consommer, et il commence à arbitrer entre eux.

Le détail qui rend l’affaire plus parlante encore, c’est ce que Google fait en parallèle pour combler ce trou. L’entreprise a accepté de payer 920 millions de dollars par mois à SpaceX pour accéder à 110 000 GPU Nvidia. Plus de 900 millions de dollars mensuels, soit un rythme qui dépasse les 11 milliards de dollars sur une année pleine, pour louer de la puissance de calcul à la société spatiale d’Elon Musk.

Pour bien saisir l’affaire, il faut garder en tête le sens du mot client ici. Meta dispose de ses propres modèles d’IA et de ses propres data centers. Si elle achetait quand même de la capacité Gemini à Google, c’est sans doute pour des usages où les modèles maison ne suffisaient pas, ou pour absorber des pics de demande sans tout construire elle-même. Quand un fournisseur plafonne ce genre de client, il envoie un signal clair : la rareté ne touche plus seulement les petites entreprises, elle remonte jusqu’aux plus gros acteurs de la tech.

Pourquoi cet accord avec SpaceX étonne

SpaceX n’est pas un acteur que l’on attend sur ce terrain. C’est une entreprise de lancements spatiaux et de satellites, pas un loueur de centres de données pour l’IA. Voir Google, géant du cloud, aller chercher 110 000 cartes graphiques Nvidia chez SpaceX en dit long sur l’état du marché. Quand une entreprise capable de construire ses propres data centers à grande échelle se met à louer du calcul ailleurs, et à ce prix, c’est que la demande dépasse largement ce que son infrastructure peut absorber dans l’immédiat.

Les GPU Nvidia sont les processeurs de référence pour entraîner et faire tourner les grands modèles d’IA. Ce sont eux qui font tourner ChatGPT, Gemini, les outils de génération d’images, les assistants intégrés un peu partout. Ils sont rares, chers, et tout le monde les veut en même temps. La même tension fait exploser le cours des fabricants de puces mémoire. 110 000 unités, c’est un parc considérable, du genre qui se chiffre en milliards de dollars rien qu’à l’achat.

On ne sait pas précisément, à ce stade, comment SpaceX a pu réunir un tel parc de machines ni quelle part de cette capacité provient de matériel déjà installé pour ses propres besoins. Le contrat reste aussi un arrangement entre entreprises dont tous les termes ne sont pas publics. Ce qui ressort, c’est moins le détail technique que la logique : un fournisseur historique de cloud accepte de payer une rente mensuelle énorme à un voisin inattendu plutôt que d’attendre que ses propres chantiers livrent.

Le décalage entre construire et consommer

Cette histoire met en lumière un écart de calendrier. D’un côté, les annonces de méga-centres de données se multiplient, avec des projets chiffrés en dizaines de milliards. De l’autre, ces infrastructures prennent des années à sortir de terre, à se raccorder au réseau électrique, à être équipées en puces. Pendant ce temps, l’usage de l’IA, lui, explose tout de suite. Les modèles deviennent plus gros, les requêtes plus nombreuses, les fonctions IA s’ajoutent dans tous les logiciels.

Le calcul ne se résume d’ailleurs pas aux puces. Il faut le courant pour les alimenter, l’eau ou l’air pour les refroidir, les bâtiments pour les héberger, et des autorisations pour raccorder tout cela au réseau. Chacune de ces étapes a son propre rythme, souvent plus lent que celui des logiciels. Un modèle se met à jour en quelques semaines. Une centrale électrique ou une ligne haute tension se planifie sur des années. C’est ce décalage de tempo qui crée le goulot d’étranglement, bien plus que la difficulté à écrire du code.

La puissance de calcul devient alors la ressource qui manque, et elle commence à redessiner les rapports entre entreprises. Un fournisseur d’IA peut désormais limiter un client important parce qu’il n’a tout simplement plus de capacité à lui vendre. Un concurrent comme SpaceX peut devenir, le temps d’un contrat, un fournisseur stratégique pour Google. Les alliances se forment en fonction de qui a des machines disponibles, plus seulement de qui a la meilleure technologie.

Ce que ça change pour vous

Pour qui utilise l’IA sans gérer de data center, ces tensions se voient au quotidien sous des formes très concrètes. Une offre gratuite qui se met à compter vos requêtes. Un abonnement dont le prix grimpe. Une fonction promise qui arrive en accès limité, par vagues, le temps que le fournisseur trouve les machines pour la servir à tout le monde. Derrière ces frictions, il y a souvent la même cause : pas assez de calcul pour la demande.

Pour les entreprises qui bâtissent des produits sur ces modèles, le message est plus direct encore. Dépendre d’un seul fournisseur expose au risque qu’il rationne, comme Meta vient d’en faire l’expérience. La capacité réservée, les contrats négociés à l’avance et la possibilité de basculer d’un prestataire à l’autre pèsent autant que la qualité brute des modèles.

Reste une part d’incertitude. On ignore combien de temps durera cette pénurie, si les nouveaux data centers la résorberont vite ou si l’appétit pour l’IA continuera de courir devant l’offre. Ce qu’il faut surveiller, ce sont les prix des services que vous utilisez, les limites d’usage qui apparaissent ou se durcissent, et les accords surprenants entre acteurs que rien ne destinait à travailler ensemble. Le cas Google le montre bien : avoir les modèles, les ingénieurs et le cloud ne suffit pas si la file d’attente pour les puces s’allonge plus vite que les data centers ne se construisent. La contrainte physique, des cartes Nvidia branchées sur de l’électricité dans des bâtiments réels, redevient le point de tension du secteur.

Partager LinkedIn