Nur 10 reale Messungen des KI-Energieverbrauchs existieren weltweit

Nur eine direkte Produktionsmessung existiert, veröffentlicht von einem KI-Anbieter: Google maß 0,24 Wh pro Gemini-Anfrage. OpenAI gab eine Zahl ohne Methodik. Der Rest — Anthropic, Midjourney, Suno, Runway, xAI — hat absolut nichts veröffentlicht. Alles andere über KI-Verbrauch sind akademische Schätzungen oder Extrapolationen.

Von allen Zahlen zum KI-Energieverbrauch, die in Medien, akademischen Berichten und Regulierungsdebatten kursieren, sind nur eine winzige Handvoll echte Messungen in Produktionsumgebungen. Der Rest — einschließlich praktisch aller Daten zu GPT-5, Claude, Sora, Midjourney, DALL-E, Suno und allen kommerziellen Diensten — sind Schätzungen mit Fehlermargen von x2 bis x27.

Wir haben getan, was niemand zu tun scheint: ein forensisches Inventar, Datenpunkt für Datenpunkt, von allem, was wirklich gemessen wurde. Das Ergebnis ist ernüchternd.

Der einzige echte Datenpunkt: Google und seine 0,24 Wh

In der gesamten KI-Industrie existiert eine einzige direkte Produktionsmessung, die von einem KI-Anbieter veröffentlicht wurde.

Google enthüllte im August 2025, dass eine mittlere Text-Anfrage an Gemini Apps 0,24 Wh verbraucht und ungefähr 0,03 gCO₂e erzeugt — unter Verwendung marktbasierter Bilanzierung mit Ökostromzertifikaten. Die Daten wurden in einem überprüfbaren Paper (arXiv:2508.15734) mit expliziter Methodik veröffentlicht.

0,24 Wh. Eine Zahl. Ein Unternehmen. In einer Industrie, die mehr als 500 Milliarden Dollar jährlich in Infrastruktur bewegt.

Es ist wichtig zu verstehen, was diese Zahl abdeckt und was nicht: Sie bezieht sich auf mittlere Textanfragen. Sie umfasst keine Bilderzeugung mit Imagen 3, kein Video mit Veo, kein Gemini Deep Research. Es ist ein partieller Datenpunkt — aber er ist der einzige, der das Prädikat echte Messung verdient.

In einer Industrie, die verspricht, die Welt zu transformieren, hat nur ein Anbieter öffentlich gemessen, wie viel Energie sein Hauptprodukt verbraucht.

Die unbelegte Behauptung: OpenAI und seine 0,34 Wh

Sam Altman erklärte im Juni 2025, dass die durchschnittliche ChatGPT-Anfrage 0,34 Wh verbrauche. Er veröffentlichte dies in einem persönlichen Blogpost, nicht in einem Paper. Er veröffentlichte keine Methodik. Er definierte nicht, was eine „durchschnittliche Anfrage” ausmacht. Er spezifizierte nicht, ob Bilder, Deep Research oder Code Interpreter eingeschlossen sind.

Die Zahl ist plausibel — sie liegt in derselben Größenordnung wie Googles — aber sie ist nicht verifizierbar. Dies hat praktische Bedeutung: Wenn ein Unternehmen, das Milliarden von Dollar fakturiert und soeben GPT-5, GPT-5.4, Sora 2 und Codex gestartet hat, keine reproduzierbare Methodik veröffentlicht, bietet es keine Transparenz. Es bietet eine Marketingaussage.

Und die Dinge werden komplizierter, wenn wir ins Detail gehen:

GPT-5 hat laut URI AI Lab eine mittlere Schätzung von ~18,9 Wh pro Anfrage — 63 Mal die Basisreferenz
GPT-5.4 mit aktivem Reasoning kann 4–18 Wh pro Anfrage erreichen
Sora 2 verbrauchte vor seiner Schließung ~1.000 Wh pro 10-Sekunden-Clip

Keiner dieser Datenpunkte stammt von OpenAI. Alle sind Drittschätzungen.

Die akademischen Messungen: 5 Inseln der Strenge

Außerhalb der Anbieter hat eine Handvoll Forschungsgruppen das getan, was die Industrie ablehnt: wirklich messen.

1. AI Energy Score — Hugging Face

Das ambitionierteste systematische Messprojekt. Hugging Face lancierte Version 1 im Februar 2025 und v2 im Dezember 2025. Es hat den realen Verbrauch von ~205 Open-Source-Modellen gemessen, indem es sie auf Standardhardware (NVIDIA H100) ausführte.

Das Problem: Es misst nur offene Modelle. GPT-5, Claude, Gemini, Midjourney — die von der überwältigenden Mehrheit der Menschen genutzt werden — sind von Grund auf ausgeschlossen.

2. Bertazzini et al. — Die versteckten Kosten des Bildes

Veröffentlicht im Jahr 2025 (arXiv:2506.17016), maß dieses Team 17 Diffusionsmodelle zur Bilderzeugung auf einer RTX 4090. Sie fanden einen Unterschied von 46 Mal zwischen dem effizientesten und dem am wenigsten effizienten Modell.

x46. Das bedeutet, dass die Wahl des falschen Modells Ihren Verbrauch für ein Bild ähnlicher Qualität fast 50 Mal multiplizieren kann.

3. Luccioni & Delavande — Das Energiebudget des Videos

Sie maßen 7 Videoerzeugungsmodelle auf H100 (arXiv:2509.19222). Ihre Daten bestätigten, was die Industrie nicht sagen möchte: KI-Videoerzeugung verbraucht zwischen x300 und x3.000 mehr als eine Textanfrage.

4. Passoni et al. — Das Audio, das niemand misst

Erste ernsthafte Studie zum Verbrauch von Audioerzeugung (arXiv:2505.07615). Sie fanden, dass Tango2 ~2 Wh pro 10-Sekunden-Clip verbraucht und AudioLDM ungefähr ~0,25 Wh. Dies sind die einzigen Referenzdaten für die gesamte generative Audio-Industrie — Suno, Udio und ElevenLabs haben absolut nichts veröffentlicht.

5. ML.Energy — University of Michigan

Kontinuierlicher Energieeffizienz-Benchmark für Machine-Learning-Modelle. Liefert Referenzdaten für Standardhardware, aber — erneut — nur für Modelle, zu denen sie Zugang haben, nicht für geschlossene kommerzielle Dienste.

Punktmessungen: 3 isolierte Datenpunkte

Neben den systematischen Studien gibt es drei direkte Messungen spezifischer Modelle, die als Ankerreferenzen dienen:

DeepSeek-R1 (langes Reasoning): 33,6 Wh pro langer Anfrage — direkte Messung, hohe Konfidenz. Das ist 112 Mal eine einfache Textanfrage.
OpenAIs o3 (langes Reasoning): 39,2 Wh — direkte Messung. 131 Mal die Basisreferenz.
Stabilitys SDXL (Bild auf H100): 1,64 Wh pro Bild — von Hugging Face gemessener Benchmark. Der beste offene Ankerpunkt für Bilderzeugung.

Und eine besonders aufschlussreiche Messung:

Claude Code (mittlere Programmiersession): 41 Wh — gemessen von Simon P. Couch im Januar 2026. 137 Mal eine einfache Anfrage. Ein Entwickler, der Code-Agenten während eines vollen Arbeitstages verwendet, verbraucht rund 1.300 Wh — das Äquivalent eines Geschirrspülzyklus.

Das schwarze Loch: Was wir NICHT wissen

Jetzt kommt der unbequeme Teil. Dies ist das, was absolut niemand veröffentlicht hat:

Anthropic (Claude, Claude Code): null Energieverbrauchsdaten. Nie. Der neueste Umweltbericht enthält keine Anfrage-Telemetrie.
Midjourney: null Daten. Geschlossene Architektur, kein öffentliches Benchmarking.
Suno, Udio, ElevenLabs Music: null Daten. Die gesamte generative Audio-Industrie operiert in vollständiger Opazität.
Runway, Pika, Kling, Hailuo: null Daten. Die Video-Generatoren, die Sora ersetzen, veröffentlichen nichts darüber, wie viel jeder Clip verbraucht.
xAI (Grok): bestrittene Daten. Sein Colossus-Campus in Memphis läuft mit 35 unpermittierten Gasturbinen, aber sie haben keine Inferenz-Verbrauchsdaten veröffentlicht.
Adobe (Firefly): hat mehr als 24 Milliarden Assets generiert, weigert sich aber, disaggregierte Verbrauchstelemetrie pro Bild bereitzustellen.

Stell dir vor, die Automobilindustrie würde Autos ohne Kraftstoffverbrauchsetikett verkaufen. Wenn Gerätehersteller nicht veröffentlichen würden, wie viel Strom sie verbrauchen. Genau das passiert mit KI im Jahr 2026.

Die Zahlen, die existieren sollten, aber nicht existieren

Um das Ausmaß des Informationsvakuums zu verdeutlichen: Dies sind die Datenpunkte, die die Industrie heute veröffentlichen könnte — weil sie die Telemetrie dafür hat — und zu veröffentlichen wählt:

Wh pro Anfrage nach Typ (Text, Bild, Video, Audio, Code)
Wh pro Session für autonome Agenten
Gesamter Inferenzverbrauch pro Dienst pro Monat/Jahr
Wasserverbrauch für Kühlung pro Rechenzentrum
Realer Energiemix nach Dienstregion (nicht der frisierte globale Durchschnitt)

Google bewies, dass es möglich ist, diese Daten zu veröffentlichen ohne Marktanteile zu verlieren. Als es seine 0,24 Wh enthüllte, verlor es keine Nutzer. Es gewann Glaubwürdigkeit.

Der globale Rechenzentrums-Verbrauch wird von 415 TWh im Jahr 2024 auf zwischen 945 und 1.580 TWh im Jahr 2030 wachsen, laut IEA. Das entspricht dem Hinzufügen des Stromverbrauchs von Japan zum globalen System. Und der Großteil dieses Wachstums wird von KI kommen.

Informierte Entscheidungen über diese Größenordnung des Impacts mit nur 10 echten Messungen zu treffen, ist nicht schwierig. Es ist unmöglich.

Was kann ich tun?

Wenn du KI-Nutzer bist: Verlange Transparenz. Wenn du einen Dienst auswählst, frage: Veröffentlicht er Verbrauchsdaten? Unser Fußabdruck-Rechner gibt dir eine Schätzung basierend auf dem wenigen, was bekannt ist, aber es wäre besser, wenn Anbieter dir echte Daten geben würden.
Wenn du ein Unternehmen leitest: Im Rahmen des europäischen CSRD-Rahmens umfasst dein CO₂-Fußabdruck die KI-Dienste, die du beauftragst (Scope 3). Wenn dein Anbieter dir keine Verbrauchsdaten gibt, fliegst du blind in deinem Nachhaltigkeitsbericht.
Wenn du Entwickler bist: Verwende Modelle mit veröffentlichten Messungen, wenn möglich. Open-Source-Modelle, die von AI Energy Score und ML.Energy gemessen wurden, geben dir echte Daten. Geschlossene kommerzielle Dienste geben dir Versprechen.
Wenn du in der Regulierung arbeitest: Der EU AI Act (Artikel 40) sieht bereits Anforderungen an Energietransparenz vor, aber die Standards werden erst im August 2028 verbindlich. Messung ist heute möglich, ohne neue Technologie. Was fehlt, ist rechtliche Verpflichtung.

Nur 10 reale Messungen des KI-Energieverbrauchs existieren weltweit

Qualität der KI-Energieverbrauchsdaten (April 2026)

Der einzige echte Datenpunkt: Google und seine 0,24 Wh

Die unbelegte Behauptung: OpenAI und seine 0,34 Wh

Die akademischen Messungen: 5 Inseln der Strenge

1. AI Energy Score — Hugging Face

2. Bertazzini et al. — Die versteckten Kosten des Bildes

3. Luccioni & Delavande — Das Energiebudget des Videos

4. Passoni et al. — Das Audio, das niemand misst

5. ML.Energy — University of Michigan

Punktmessungen: 3 isolierte Datenpunkte

Das schwarze Loch: Was wir NICHT wissen

Die Zahlen, die existieren sollten, aber nicht existieren

Was kann ich tun?

Quellen

AISHA weiter erkunden

¿Cuánta energía consume la IA que usas cada día?

La IA puede ser la mejor herramienta de la historia — si la usamos bien

Nächster Schritt

Keine Neuigkeit verpassen.