Google a restreint l’accès de Meta à Gemini, le service d’IA de Google, autour du mois de mars, après n’avoir pas réussi à lui fournir la puissance de calcul réclamée par le groupe, d’après plusieurs sources concordantes. Les mêmes sources disent que d’autres clients de Google auraient aussi été touchés par ces limitations, même si Meta semble avoir essuyé le plus gros du choc.
Chez Meta, les effets auraient été bien réels. Certains projets internes auraient pris du retard, avec des perturbations assez nettes pour pousser l’entreprise à demander à ses équipes de serrer de plus près l’usage de ses ressources de calcul, notamment en limitant les « tokens », selon plusieurs médias. Cet épisode remet une chose au centre du jeu : dans l’IA, la bataille ne se joue plus seulement sur la qualité des modèles. Elle se joue aussi sur l’accès aux puces, à la mémoire, aux centres de données et, tout simplement, à l’électricité.
D’après plusieurs médias, Meta s’appuyait sur Gemini pour plusieurs tâches sensibles, parce que le service de Google était considéré comme meilleur que ses propres modèles Llama sur certains usages, en particulier la modération de contenus, la lutte contre les arnaques et certains dispositifs de sécurité. Puis Google a commencé à rationner l’accès, et la donne a changé.
Ce qui surprend, c’est que le problème ne semble pas venir d’un simple choix commercial.
Malgré l’une des plus grosses infrastructures de calcul au monde et plus de 180 milliards de dollars de dépenses d’investissement cette année, selon plusieurs médias, Google a lui aussi du mal à encaisser la demande. Sundar Pichai a récemment reconnu que des limites de capacité avaient freiné la croissance de Google Cloud et presque doublé le carnet de commandes au premier trimestre. Dit plus simplement, même les géants n’ont pas assez de machines pour servir tout le monde.
La réponse de Meta prend donc une tournure très stratégique : réduire sa dépendance aux fournisseurs extérieurs.
Meta bascule progressivement davantage de charges de travail vers Muse Spark, son modèle maison lancé sous la bannière de Superintelligence Labs. Ce virage fait partie d’un plan beaucoup plus vaste : Meta a redirigé des milliards vers ses infrastructures de calcul, prévoit entre 115 et 135 milliards de dépenses d’investissement en 2026 et a réaffecté environ 7 000 salariés à des postes centrés sur ces technologies, selon plusieurs médias. Le cap est limpide : reprendre la main sur un maximum de briques critiques, plutôt que de rester accroché à un concurrent direct.
Pour l’instant, Google et Meta n’ont pas expliqué publiquement jusqu’où vont exactement ces restrictions. Mieux vaut donc garder une part de prudence.
Mais, pour les analystes, la pression ne vient déjà plus seulement de l’entraînement des modèles. Elle se déplace de plus en plus vers leur exécution à grande échelle, parce que chaque requête d’utilisateur finit par retomber sur des infrastructures déjà sous tension.
Google chercherait d’ailleurs des parades temporaires pour se donner un peu d’air, avec un accord conclu avec SpaceX, évalué à environ 920 millions de dollars par mois, afin d’accéder à 110 000 puces Nvidia, selon plusieurs médias. Cette capacité serait présentée comme une réponse transitoire pour suivre l’explosion de la demande autour de Gemini Enterprise.
Plus largement que le face-à-face entre Google et Meta, cet épisode montre que le rapport de force a changé : les grandes plateformes sont à la fois clientes, fournisseuses et concurrentes. Et sur un marché bloqué par les limites d’infrastructure, ceux qui possèdent les machines partent avec un net avantage, quitte à renvoyer les acteurs plus petits au fond de la file. Nous vous tiendrons informés.