Sinds maart heeft Google Meta’s toegang tot Gemini beperkt. De reden was volgens berichtgeving vrij simpel: er was niet genoeg rekenkracht beschikbaar voor wat Meta vroeg. Die beperkingen zouden rond maart zijn ingegaan. Andere klanten kregen er naar verluidt ook mee te maken, maar Meta lijkt opvallend hard te zijn geraakt.
De impact bleef niet hangen bij een lastig contractgesprek. Binnen Meta leidde de maatregel volgens berichten tot vertraging bij meerdere projecten. Medewerkers kregen daarna te horen dat ze zuiniger moesten omgaan met hun tokenverbruik.
Daar zit ook meteen de echte flessenhals in deze markt. Niet bij de modellen zelf, en ook niet bij het beschikbare talent, maar bij de fysieke laag eronder: GPU’s, geheugen, stroomvoorziening en datacenters. Volgens de berichtgeving staat daar extra veel druk op, omdat de vraag naar gebruik in productie veel harder groeit dan het aanbod.
Bedrijven willen modellen allang niet meer alleen uitproberen. Ze willen ze, zo klinkt het, op grote schaal inzetten voor moderatie, detectie en automatisering. Juist dat dagelijkse, grootschalige gebruik slokt capaciteit op. Google pompt volgens berichten al stevig geld in het opvangen van dat probleem.
Dat is ook nodig. Google stopt dit jaar naar verluidt meer dan 180 miljard in infrastructuur en kan nog steeds niet alle vraag aan. Topman Sundar Pichai zei eerder al dat beperkte rekenkracht de groei van Google Cloud heeft afgeremd. De contractachterstand is in het eerste kwartaal bovendien bijna verdubbeld.
Voor Meta ligt dit extra gevoelig, omdat het Google Gemini volgens berichten inzette voor taken waarop dat model beter zou presteren dan Meta’s eigen Llama-familie. Denk aan contentmoderatie, het verwijderen van schadelijke inhoud en het opsporen van scams. Nu die toegang is ingeperkt, schuift Meta volgens berichten meer van dat werk door naar Muse Spark, een intern model onder de vlag van Superintelligence Labs.
Meta wil daar, als de berichten kloppen, minder afhankelijk mee worden van externe leveranciers. Zeker als die leveranciers tegelijk ook concurrent zijn. Die draai past in een bredere heroriëntatie: Meta heeft volgens berichten 8.000 banen geschrapt, miljarden verschoven naar modelontwikkeling en infrastructuur, 7.000 medewerkers op andere functies gezet met focus op deze technologie en rekent voor 2026 op 115 tot 135 miljard aan investeringen.
Dat zelfs Google capaciteit moet rantsoeneren, zegt genoeg over hoe krap deze markt inmiddels is. Een veelzeggend voorbeeld is een gemelde deal waarbij Google volgens berichten zo’n 920 miljoen per maand zou betalen aan SpaceX voor toegang tot 110.000 Nvidia-GPU’s, als tijdelijke overbrugging voor de snel oplopende vraag naar Gemini Enterprise.
Analisten zien daarin volgens berichten een voorproefje van wat breder aan het gebeuren is. Er ontstaat een scheidslijn tussen bedrijven met volop rekenkracht en partijen die achteraan in de rij moeten aansluiten. Voor startups en kleinere cloudklanten kan dat, zeggen die analisten, uitmonden in hogere prijzen, wachttijden of simpelweg beperkte toegang.
Tegelijk neemt volgens berichten de drang toe om meer zelf te bouwen, zodat cruciale systemen niet afhankelijk zijn van een rivaal. De wedloop gaat daardoor steeds minder over wie het slimste model heeft, en steeds meer over wie genoeg chips, stroom en datacenterruimte weet veilig te stellen.