1
Direkte Produktionsmessung eines Anbieters
Verbrauch
Ein forensisches Inventar von allem, was wir wissen — und nicht wissen — über den Energieverbrauch künstlicher Intelligenz
Von allen Zahlen zum KI-Energieverbrauch, die in Medien, Berichten und Regulierungsdebatten kursieren, sind nur eine winzige Handvoll echte Messungen. Der Rest sind Schätzungen mit Fehlermargen von x 2 bis x 27.
Nur eine direkte Produktionsmessung existiert, veröffentlicht von einem KI-Anbieter: Google maß 0,24 Wh pro Gemini-Anfrage. OpenAI gab eine Zahl ohne Methodik. Der Rest — Anthropic, Midjourney, Suno, Runway, xAI — hat absolut nichts veröffentlicht. Alles andere über KI-Verbrauch sind akademische Schätzungen oder Extrapolationen.
1
Direkte Produktionsmessung eines Anbieters
~ 10
Echte Messungen insgesamt (akademisch + Produktion)
0
Daten von Anthropic, Midjourney oder Suno
x 27
Maximale Fehlermarge in Drittschätzungen
Direkte Produktionsmessung
1
Google Gemini
Unternehmensaussage ohne Methodik
1
OpenAI ChatGPT
Akademische Messungen auf Standardhardware
5
AI Energy Score (Hugging Face), Bertazzini et al. (Bild), Luccioni (Video), Passoni et al. (Audio), ML.Energy (Michigan)
Punktmessungen spezifischer Modelle
3
DeepSeek-R1 (33,6 Wh), o3 (39,2 Wh), SDXL (1,64 Wh)
Kommerzielle Anbieter ohne jegliche Daten
10
Anthropic, Midjourney, Stability AI, Suno, Udio, ElevenLabs, Runway, Pika, xAI, MiniMax
Von allen Zahlen zum KI-Energieverbrauch, die in Medien, akademischen Berichten und Regulierungsdebatten kursieren, sind nur eine winzige Handvoll echte Messungen in Produktionsumgebungen. Der Rest — einschließlich praktisch aller Daten zu GPT-5, Claude, Sora, Midjourney, DALL-E, Suno und allen kommerziellen Diensten — sind Schätzungen mit Fehlermargen von x2 bis x27.
Wir haben getan, was niemand zu tun scheint: ein forensisches Inventar, Datenpunkt für Datenpunkt, von allem, was wirklich gemessen wurde. Das Ergebnis ist ernüchternd.
In der gesamten KI-Industrie existiert eine einzige direkte Produktionsmessung, die von einem KI-Anbieter veröffentlicht wurde.
Google enthüllte im August 2025, dass eine mittlere Text-Anfrage an Gemini Apps 0,24 Wh verbraucht und ungefähr 0,03 gCO₂e erzeugt — unter Verwendung marktbasierter Bilanzierung mit Ökostromzertifikaten. Die Daten wurden in einem überprüfbaren Paper (arXiv:2508.15734) mit expliziter Methodik veröffentlicht.
0,24 Wh. Eine Zahl. Ein Unternehmen. In einer Industrie, die mehr als 500 Milliarden Dollar jährlich in Infrastruktur bewegt.
Es ist wichtig zu verstehen, was diese Zahl abdeckt und was nicht: Sie bezieht sich auf mittlere Textanfragen. Sie umfasst keine Bilderzeugung mit Imagen 3, kein Video mit Veo, kein Gemini Deep Research. Es ist ein partieller Datenpunkt — aber er ist der einzige, der das Prädikat echte Messung verdient.
In einer Industrie, die verspricht, die Welt zu transformieren, hat nur ein Anbieter öffentlich gemessen, wie viel Energie sein Hauptprodukt verbraucht.
Sam Altman erklärte im Juni 2025, dass die durchschnittliche ChatGPT-Anfrage 0,34 Wh verbrauche. Er veröffentlichte dies in einem persönlichen Blogpost, nicht in einem Paper. Er veröffentlichte keine Methodik. Er definierte nicht, was eine „durchschnittliche Anfrage” ausmacht. Er spezifizierte nicht, ob Bilder, Deep Research oder Code Interpreter eingeschlossen sind.
Die Zahl ist plausibel — sie liegt in derselben Größenordnung wie Googles — aber sie ist nicht verifizierbar. Dies hat praktische Bedeutung: Wenn ein Unternehmen, das Milliarden von Dollar fakturiert und soeben GPT-5, GPT-5.4, Sora 2 und Codex gestartet hat, keine reproduzierbare Methodik veröffentlicht, bietet es keine Transparenz. Es bietet eine Marketingaussage.
Und die Dinge werden komplizierter, wenn wir ins Detail gehen:
Keiner dieser Datenpunkte stammt von OpenAI. Alle sind Drittschätzungen.
Außerhalb der Anbieter hat eine Handvoll Forschungsgruppen das getan, was die Industrie ablehnt: wirklich messen.
Das ambitionierteste systematische Messprojekt. Hugging Face lancierte Version 1 im Februar 2025 und v2 im Dezember 2025. Es hat den realen Verbrauch von ~205 Open-Source-Modellen gemessen, indem es sie auf Standardhardware (NVIDIA H100) ausführte.
Das Problem: Es misst nur offene Modelle. GPT-5, Claude, Gemini, Midjourney — die von der überwältigenden Mehrheit der Menschen genutzt werden — sind von Grund auf ausgeschlossen.
Veröffentlicht im Jahr 2025 (arXiv:2506.17016), maß dieses Team 17 Diffusionsmodelle zur Bilderzeugung auf einer RTX 4090. Sie fanden einen Unterschied von 46 Mal zwischen dem effizientesten und dem am wenigsten effizienten Modell.
x46. Das bedeutet, dass die Wahl des falschen Modells Ihren Verbrauch für ein Bild ähnlicher Qualität fast 50 Mal multiplizieren kann.
Sie maßen 7 Videoerzeugungsmodelle auf H100 (arXiv:2509.19222). Ihre Daten bestätigten, was die Industrie nicht sagen möchte: KI-Videoerzeugung verbraucht zwischen x300 und x3.000 mehr als eine Textanfrage.
Erste ernsthafte Studie zum Verbrauch von Audioerzeugung (arXiv:2505.07615). Sie fanden, dass Tango2 ~2 Wh pro 10-Sekunden-Clip verbraucht und AudioLDM ungefähr ~0,25 Wh. Dies sind die einzigen Referenzdaten für die gesamte generative Audio-Industrie — Suno, Udio und ElevenLabs haben absolut nichts veröffentlicht.
Kontinuierlicher Energieeffizienz-Benchmark für Machine-Learning-Modelle. Liefert Referenzdaten für Standardhardware, aber — erneut — nur für Modelle, zu denen sie Zugang haben, nicht für geschlossene kommerzielle Dienste.
Neben den systematischen Studien gibt es drei direkte Messungen spezifischer Modelle, die als Ankerreferenzen dienen:
DeepSeek-R1 (langes Reasoning): 33,6 Wh pro langer Anfrage — direkte Messung, hohe Konfidenz. Das ist 112 Mal eine einfache Textanfrage.
OpenAIs o3 (langes Reasoning): 39,2 Wh — direkte Messung. 131 Mal die Basisreferenz.
Stabilitys SDXL (Bild auf H100): 1,64 Wh pro Bild — von Hugging Face gemessener Benchmark. Der beste offene Ankerpunkt für Bilderzeugung.
Und eine besonders aufschlussreiche Messung:
Jetzt kommt der unbequeme Teil. Dies ist das, was absolut niemand veröffentlicht hat:
Anthropic (Claude, Claude Code): null Energieverbrauchsdaten. Nie. Der neueste Umweltbericht enthält keine Anfrage-Telemetrie.
Midjourney: null Daten. Geschlossene Architektur, kein öffentliches Benchmarking.
Suno, Udio, ElevenLabs Music: null Daten. Die gesamte generative Audio-Industrie operiert in vollständiger Opazität.
Runway, Pika, Kling, Hailuo: null Daten. Die Video-Generatoren, die Sora ersetzen, veröffentlichen nichts darüber, wie viel jeder Clip verbraucht.
xAI (Grok): bestrittene Daten. Sein Colossus-Campus in Memphis läuft mit 35 unpermittierten Gasturbinen, aber sie haben keine Inferenz-Verbrauchsdaten veröffentlicht.
Adobe (Firefly): hat mehr als 24 Milliarden Assets generiert, weigert sich aber, disaggregierte Verbrauchstelemetrie pro Bild bereitzustellen.
Stell dir vor, die Automobilindustrie würde Autos ohne Kraftstoffverbrauchsetikett verkaufen. Wenn Gerätehersteller nicht veröffentlichen würden, wie viel Strom sie verbrauchen. Genau das passiert mit KI im Jahr 2026.
Um das Ausmaß des Informationsvakuums zu verdeutlichen: Dies sind die Datenpunkte, die die Industrie heute veröffentlichen könnte — weil sie die Telemetrie dafür hat — und zu veröffentlichen wählt:
Google bewies, dass es möglich ist, diese Daten zu veröffentlichen ohne Marktanteile zu verlieren. Als es seine 0,24 Wh enthüllte, verlor es keine Nutzer. Es gewann Glaubwürdigkeit.
Der globale Rechenzentrums-Verbrauch wird von 415 TWh im Jahr 2024 auf zwischen 945 und 1.580 TWh im Jahr 2030 wachsen, laut IEA. Das entspricht dem Hinzufügen des Stromverbrauchs von Japan zum globalen System. Und der Großteil dieses Wachstums wird von KI kommen.
Informierte Entscheidungen über diese Größenordnung des Impacts mit nur 10 echten Messungen zu treffen, ist nicht schwierig. Es ist unmöglich.
Wenn du KI-Nutzer bist: Verlange Transparenz. Wenn du einen Dienst auswählst, frage: Veröffentlicht er Verbrauchsdaten? Unser Fußabdruck-Rechner gibt dir eine Schätzung basierend auf dem wenigen, was bekannt ist, aber es wäre besser, wenn Anbieter dir echte Daten geben würden.
Wenn du ein Unternehmen leitest: Im Rahmen des europäischen CSRD-Rahmens umfasst dein CO₂-Fußabdruck die KI-Dienste, die du beauftragst (Scope 3). Wenn dein Anbieter dir keine Verbrauchsdaten gibt, fliegst du blind in deinem Nachhaltigkeitsbericht.
Wenn du Entwickler bist: Verwende Modelle mit veröffentlichten Messungen, wenn möglich. Open-Source-Modelle, die von AI Energy Score und ML.Energy gemessen wurden, geben dir echte Daten. Geschlossene kommerzielle Dienste geben dir Versprechen.
Wenn du in der Regulierung arbeitest: Der EU AI Act (Artikel 40) sieht bereits Anforderungen an Energietransparenz vor, aber die Standards werden erst im August 2028 verbindlich. Messung ist heute möglich, ohne neue Technologie. Was fehlt, ist rechtliche Verpflichtung.
Verwandte
La guía definitiva del consumo energético por modelo y modalidad en 2026
Manifiesto AISHA: por qué defendemos la inteligencia artificial y por qué exigimos que se use de forma responsable
Abonnieren Sie den redaktionellen Newsletter von AISHA, um über neue Beiträge, Berichte und Tools auf dem Laufenden zu bleiben.
Zum Newsletter