Google hat Meta Platforms Berichten zufolge seit etwa März beim Zugriff auf das KI-Modell Google Gemini ausgebremst. Seitdem gelten offenbar engere Grenzen, und die haben bei Meta gleich mehrere interne Projekte verlangsamt. Das fällt ins Gewicht, weil der Konzern Gemini für produktive Aufgaben eingesetzt hatte: In manchen Bereichen lieferte das Modell offenbar bessere Ergebnisse als Metas eigene Llama-Varianten.
Gemini-Limits bremsen interne Projekte bei Meta
Die Einschränkungen sollen seit rund März gelten. Laut den Berichten haben sie mehrere interne Projekte bei Meta gebremst, teils spürbar. Für den Konzern ist das keine bloße technische Unannehmlichkeit. Meta hatte Google Gemini in produktiven Abläufen im Einsatz, gerade weil das Modell in einzelnen Disziplinen besser abschnitt als die hauseigenen Meta-Llama-Modelle. Entsprechend schnell musste intern umgeplant werden.
Strengere Vorgaben für Tokens und weniger Kapazität
Intern zog Meta Berichten zufolge die Zügel bei den Rechenressourcen an. Mitarbeitende bekamen laut den Berichten strengere Vorgaben und sollten mit Tokens sparsamer umgehen. Gemeint ist die Maßeinheit, über die Nutzung großer Modelle abgerechnet und gesteuert wird.
Das sollte die Engpässe abfedern. Gleichzeitig brachte es neue Probleme mit sich: mehr Verzögerungen, weniger verfügbare Kapazität. Brisant ist das vor allem deshalb, weil Meta Google Gemini laut den Berichten nicht für Nebenaufgaben verwendet hat, sondern für zentrale Prozesse. Genannt werden unter anderem Inhaltsmoderation, die Abwehr von Betrugsversuchen und weitere sicherheitsrelevante Workflows.
Meta beschleunigt den Umstieg auf Muse Spark
Die Einschränkungen treiben jetzt offenbar auch einen Strategiewechsel an. Meta verschiebt mehr Last auf das eigene Modell Muse Spark, um sich von Google unabhängiger zu machen.
Dass ausgerechnet ein direkter Rivale kritische Infrastruktur für zentrale Abläufe bereitstellt, war ohnehin keine besonders bequeme Ausgangslage. Dazu passt auch, wie stark Meta seine Ausgaben für Rechenzentren und Hardware hochfährt. Für 2026 stellte der Konzern Berichten zufolge 115 bis 135 Milliarden Dollar in Aussicht. Hinzu kommt, dass laut den Berichten rund 7.000 Beschäftigte auf Aufgaben rund um Modelle und Infrastruktur umgelenkt wurden. Das wirkt deshalb weniger wie eine spontane Reaktion auf akute Engpässe, sondern eher wie ein Baustein in einer größeren Strategie zur Selbstversorgung.
Das eigentliche Problem liegt bei der Infrastruktur
Der Fall zeigt vor allem, wo der Flaschenhals inzwischen sitzt. Knapp sind längst nicht mehr nur einzelne Komponenten, sondern gleich mehrere zugleich: Grafikprozessoren, HBM-Speicher, Strom und freie Fläche in Rechenzentren.
Im praktischen Betrieb schlägt das besonders hart durch, wenn Modelle rund um die Uhr Anfragen beantworten oder Inhalte prüfen müssen. Und das betrifft nicht nur kleinere Anbieter. Selbst Google bekommt die Folgen zu spüren: Obwohl der Konzern nach eigenen Angaben in diesem Jahr mehr als 180 Milliarden Dollar investiert, hat CEO Sundar Pichai laut Unternehmensangaben bereits eingeräumt, dass begrenzte Kapazitäten das Wachstum von Google Cloud bremsen. Im ersten Quartal habe sich der Auftragsrückstau dadurch laut Pichai nahezu verdoppelt.
Ungewöhnliche Deals für zusätzliche Kapazität
Wie groß der Druck inzwischen ist, lässt sich auch an den Beschaffungswegen ablesen. Google soll Berichten zufolge rund 920 Millionen Dollar pro Monat an SpaceX zahlen, um sich übergangsweise den Zugriff auf 110.000 Nvidia-GPUs zu sichern.
Auch Anthropic soll laut den Berichten ein komplettes Rechenzentrum von SpaceX anmieten. Für den Markt hätte das Folgen, die über einzelne Unternehmen hinausgehen. Wer Zugriff auf Chips, Energie und Rechenzentren hat, verschafft sich einen Vorsprung, der sich nur schwer aufholen lässt. Kleinere Anbieter könnten weiter an den Rand gedrängt werden. Große Konzerne wie Meta dagegen könnten, falls der Ausbau in diesem Tempo weitergeht, selbst zu wichtigen Anbietern von Rechenkapazität werden.