Abstrakte Illustration eines digitalen Bildes im Aufbau, Pixel die sich aus Energiepartikeln formen, in Cyan- und Bernsteintönen auf dunklem Hintergrund

Ein KI-Bild verbraucht so viel wie viermal dein Smartphone laden

Warum KI-Bildgenerierung zwischen 3- und 33-mal mehr Energie kostet als eine Textanfrage — und was du dagegen tun kannst

Von AISHA · 13. März 2026 · 3 Min. Lesezeit

Ein einziges mit GPT-4o generiertes Bild kann bis zu 10 Wh verbrauchen — die gleiche Energie wie viermal dein Smartphone laden. Und der Unterschied zwischen dem effizientesten und dem am wenigsten effizienten Modell beträgt x 46.

Ein KI-generiertes Bild verbraucht je nach Modell zwischen 0,5 und 10 Wh — x 3 bis x 33 mehr als eine Textanfrage. Das schwerste Modell verbraucht 46-mal mehr als das leichteste bei ähnlicher Qualität. Das richtige Modell wählen, die Auflösung senken wenn es nicht darauf ankommt und unnötige Regenerierungen vermeiden sind die wirkungsvollsten Entscheidungen.

Energieverbrauch pro generiertem Bild nach Modell (Wh)

FLUX.2 klein (kompakt)

0,5 Wh

Imagen 3 (Google)

1,5 Wh

SDXL (Benchmark)

1,64 Wh

Midjourney v7 (Draft)

1,5 Wh

FLUX.2 dev/full

3,75 Wh

Midjourney v8 Alpha

3 Wh

Firefly Image 4 (Adobe)

2,4 Wh

GPT-4o natives Bild

5,35 Wh

x 46

Unterschied zwischen dem effizientesten und am wenigsten effizienten Modell

x 3-x33

Multiplikator vs. Textanfrage (0,3 Wh)

0

Bildanbieter, die tatsächliche Wh veröffentlichen

Bis zu 10 Wh für ein einziges Bild. So viel kann die Generierung eines Bildes mit GPT-4o im höchsten Qualitätsmodus verbrauchen — die gleiche Energie wie viermal dein Smartphone laden. Und die meisten Menschen tun es, ohne es zu wissen, mehrmals am Tag.

Während eine Textanfrage an ein KI-Modell etwa 0,3 Wh als Referenzwert verbraucht, kostet die Generierung eines Bildes 3- bis 33-mal mehr. Und der Unterschied zwischen der Wahl des einen oder anderen Modells kann 46-fach sein.


Die Verbrauchslandkarte: Modell für Modell

Nicht alle Bildgeneratoren verbrauchen gleich viel. Bertazzini et al. haben 17 Diffusionsmodelle auf standardisierter Hardware gemessen und brutale Unterschiede gefunden. Wenn man ihre Daten mit den zuverlässigsten verfügbaren Schätzungen für 2026 kombiniert, ergibt sich folgendes Bild:

  • FLUX.2 klein (Black Forest Labs, kompakte Variante): 0,15-0,8 Wh — das effizienteste verfügbare Modell, entwickelt um auf Consumer-Hardware zu laufen
  • Imagen 3 (Google, auf TPU v6): 0,5-2,5 Wh — wahrscheinlich das effizienteste unter den kommerziellen Diensten
  • SDXL (Stability, offener Benchmark auf H100): 1,64 Wh — der beste tatsächlich gemessene Referenzpunkt
  • Midjourney v7 (Draft-Modus): 1-2 Wh — der Schnellmodus spart erheblich
  • Midjourney v8 Alpha: 2-4 Wh pro Grid — die neue Version priorisiert extremen Realismus über Effizienz
  • Adobe Firefly Image 4: 0,8-4 Wh — Adobe hat über 24 Milliarden Assets generiert, ohne einen einzigen Verbrauchswert zu veröffentlichen
  • FLUX.2 dev/full (32B Parameter): 1,5-6 Wh — großes Modell, deutlich schwerer als seine Klein-Version
  • GPT-4o natives Bild: 0,7-10 Wh — die größte Spannbreite, abhängig von der gewählten Qualität und Auflösung

1,64 Wh. Das ist die solideste Referenzzahl, die für generative Bilderzeugung existiert: SDXL gemessen auf H100 durch den AI Energy Score. Alles andere sind Schätzungen.


Was ein Bild wirklich kostet

Um es in Kontext zu setzen, entspricht ein einzelnes KI-Bild:

  • FLUX.2 klein (0,5 Wh): eine LED-Lampe 3 Minuten lang eingeschaltet
  • SDXL (1,64 Wh): eine LED-Lampe 10 Minuten lang eingeschaltet
  • Midjourney v8 (3 Wh): eine LED-Lampe 18 Minuten lang eingeschaltet
  • GPT-4o hohe Qualität (10 Wh): ein Smartphone komplett laden (14 Wh ≈ 1 Ladung)

Klingt wenig. Aber multipliziere es mit der Anzahl der Regenerierungen, bis dich das Ergebnis überzeugt. Wenn du 10 Iterationen brauchst, um mit Midjourney v8 zum endgültigen Bild zu kommen, hast du 30 Wh verbraucht — das Äquivalent von zwei Smartphone-Ladungen.

Die wahren Kosten eines KI-Bildes sind nicht, es einmal zu generieren. Es sind die zehn Male, bis es dir gefällt.


Drei Entscheidungen, die den Verbrauch verändern

1. Wähle das zur Aufgabe passende Modell

Wenn du ein Bild für einen Entwurf, eine interne Präsentation oder einen Prototyp brauchst, verbraucht ein kompaktes Modell wie FLUX.2 klein oder der Draft-Modus von Midjourney 10- bis 20-mal weniger als GPT-4o in maximaler Qualität. Reserviere die schweren Modelle für das Endergebnis.

2. Reduziere die Regenerierungen

Jeder „Versuch” generiert ein komplettes Bild von Grund auf. Verfeinere den Prompt vor dem Generieren. Verwende feste Seeds, um über Variationen zu iterieren. Ein gut definierter Prompt kann dir 5-8 Regenerierungen ersparen — und deine Effizienz um denselben Faktor multiplizieren.

3. Senke die Auflösung, wenn es nicht darauf ankommt

Die Auflösung skaliert den Verbrauch nichtlinear. Bei 512x512 zu generieren verbraucht deutlich weniger als bei 1024x1024. Wenn das Bild für ein Thumbnail, einen Social-Media-Post oder ein Wireframe bestimmt ist, ist die maximale Auflösung pure Energieverschwendung.


Was kann ich tun?

  • Wenn du regelmäßig KI-Bilder nutzt: Verwende unseren Fußabdruck-Rechner, um deinen monatlichen Verbrauch zu schätzen. Und denke daran: Der Draft-Modus oder kompakte Modelle decken 80 % der Fälle zu einem Bruchteil der Kosten ab.

  • Wenn du ein Kreativteam leitest: Lege eine Nutzungsrichtlinie fest: leichtes Modell für die Iteration, schweres Modell nur für das finale Ergebnis. Das kann den Verbrauch deines Teams um 70-80 % reduzieren, ohne die Ausgabequalität zu beeinträchtigen.

  • Wenn du Entwickler bist: Integriere standardmäßig effiziente Modelle in deine Pipelines. FLUX.2 klein für Previews, größere Modelle nur wenn der Nutzer ausdrücklich hohe Qualität anfordert. Der Nutzer braucht selten 1024x1024 für einen ersten Blick.

Quellen

Verwandte

AISHA weiter erkunden

Nächster Schritt

Berechnen Sie den ungefähren Einfluss Ihrer KI-Nutzung.

Unser Rechner hilft Ihnen, Abfragen, Bilder, Reasoning und Agenten in den Kontext zu setzen.

Rechner öffnen