Fonts primàries realment útils
10
Entre papers, benchmarks oberts, declaracions corporatives i estimacions auditables.
Transparència / Opacitat
Mapa de quins proveïdors publiquen dades, quins no i amb quina qualitat metodològica.
A abril de 2026, gairebé tot el debat sobre consum energètic d'IA descansa sobre un grapat de mesuraments de laboratori, una sola xifra granular de producció i diverses estimacions corporatives o acadèmiques amb marges d'error elevats. El problema principal no és la manca d'interès: és la manca de telemetria oberta i comparable per servei.
Fonts primàries realment útils
10
Entre papers, benchmarks oberts, declaracions corporatives i estimacions auditables.
Rang públic per a una consulta de text
0,24-0,34 Wh
Google i OpenAI marquen l'estret tram conegut de referència per a xat general.
Desviació màxima observada
x 27
Les cadenes d'estimació opaques poden disparar la diferència entre la dada inferida i la real.
Aquest inventari separa mesurament directe, dades de producció i estimació indirecta per respondre una pregunta simple: què sabem de veritat i què continuem suposant.
La conclusió és incòmoda: la majoria de xifres que circulen a la premsa, la regulació i el màrqueting no són telemetria verificable. Són aproximacions construïdes sobre hardware suposat, utilització estimada i models propietaris que continuen tancats.
Escala logarítmica basada en el rang públic més citat per a text, generació d'imatge i vídeo open source.
Conclusió: el problema central ja no és calcular un número bonic, sinó distingir entre telemetria real i narrativa especulativa. Sense aquest tall, qualsevol comparació entre models continua sent fràgil.
Aquest bloc reuneix les fonts que de veritat aporten alguna cosa al debat energètic: mesurament directe en laboratori, un cas de producció granular i un petit conjunt d'estimacions acadèmiques o corporatives que, fins i tot amb límits, ajuden a fitar ordres de magnitud.
Filtra per tipus per distingir producció real, laboratori obert i estimació indirecta.
| Valor reportat | Troballa clau | ||
|---|---|---|---|
| Google — mediana de Gemini Agost 2025 · arXiv:2508.15734v1 | Producció | 0,24 Wh / consulta | Única xifra granular de producció publicada amb TPU, overhead de host i PUE inclosos. |
| Sam Altman — ChatGPT Juny 2025 · blog corporatiu | Estimació | 0,34 Wh / consulta | Serveix com a referència mediàtica, però arriba sense metodologia, peer review ni desglossament per modalitat. |
| Hugging Face AI Energy Score Desembre 2025 · Sasha Luccioni et al. | Directa | 1 a 5 estrelles | Compara més de 200 models oberts i mostra que el raonament pot disparar el consum fins a centenars de vegades. |
| ML.Energy (University of Michigan) 2025-2026 · Jae-Won Chung et al. | Directa | Leaderboard obert | Dona context útil per a models open source, però no resol la caixa negra dels proveïdors tancats. |
| The Hidden Cost of an Image Juny 2025 · arXiv:2506.17016 | Directa | Fins a x46 entre models | Confirma l'enorme dispersió energètica en imatge i la poca utilitat de comparar per marca sense context tècnic. |
| Video Killed the Energy Budget Setembre 2025 · arXiv:2509.19222 | Directa | Fins a x2.000 vs text | El vídeo open source ja marca una ruptura física clara: la modalitat importa més que el màrqueting del model. |
| Àudio generatiu Maig 2025 · arXiv:2505.07615 | Directa | Varia per model | És gairebé l'única referència empírica útil per a text-to-audio i deixa fora les plataformes comercials dominants. |
| How Hungry is AI? 2025 · arXiv:2505.09598 | Estimació | o3: 39,2 Wh · Claude 3.7: 17 Wh | Bona foto d'escenaris possibles, però continua sent inferència teòrica basada en preus i supòsits de hardware. |
| Simulació Monte Carlo bottom-up Setembre 2025 · arXiv:2509.20241 | Estimació | Mediana 0,34 Wh | És una de les millors aproximacions acadèmiques, però depèn de massa hipòtesis d'entrada no observables. |
| Claude Code energy estimate Gener 2026 · Simon P. Couch | Estimació | 41 Wh / sessió mediana | Útil per dimensionar agents, tot i que el propi autor reconeix un marge d'error proper a x3. |
La taula resumeix troballes comparables. El detall llarg i les limitacions metodològiques continuen estant a les fonts originals.
L'opacitat no és homogènia. Hi ha un buit especialment greu en agents, vídeo comercial, inferència agregada i càrregues distribuïdes dins de plataformes tancades. Aquesta taula documenta quina informació clau continua sense publicar-se i on ja hi ha rebuig explícit o silenci sostingut.
Filtra per proveïdor per veure quins forats d'informació continuen oberts.
| Dada que falta | Estat | |
|---|---|---|
| OpenAI Text (GPT-5) | Consum real per consulta | Sense dades |
| OpenAI Imatge (DALL-E / GPT-4o) | Consum real per imatge | Sense dades |
| OpenAI Vídeo (Sora 2) | Consum per clip en producció | Sense dades |
| OpenAI Agent (Deep Research) | Consum real per sessió | Sense dades |
| Anthropic Text (Claude) | Consum real per consulta en producció | Sense dades |
| Anthropic Agents (Claude Code / Research) | Consum real per sessió automatitzada | Sense dades |
| Google Agent (Gemini Deep Research) | Consum real per sessió | Petició rebutjada |
| Google Vídeo (Veo 2/3) | Consum per clip en producció | Sense dades |
| Meta Inferència integrada | Consum agregat d'IA a Facebook, Instagram i WhatsApp | Sense dades |
| xAI Text (Grok 4) | Consum real i emissions de Colossus | Sense dades |
| Plataformes musicals Suno / Udio | Qualsevol dada empírica pública | Sense dades |
| Vídeo comercial Runway / Pika / Kling | Qualsevol dada empírica pública | Sense dades |
L'absència de dades no significa absència de telemetria interna. Significa absència de publicació útil per a clients, reguladors o investigadors.
L'opacitat més greu ja no està en l'entrenament, sinó en la inferència comercial recurrent: agents, vídeo, eines integrades en suites de productivitat i consum agregat de plataformes amb milers de milions d'usuaris.
El fet que Google hagi pogut publicar una mediana per consulta i, alhora, rebutjar dades més concretes per a serveis intensius mostra que la barrera és selectiva. Es comparteix el suficient per marcar relat, no el suficient per permetre comparació.
Si la indústria coneix el consum exacte per gestionar capacitat, preus i límits d'ús, llavors l'absència de publicació no és ignorància: és estratègia.
Les estimacions bottom-up no fallen per mala fe individual, sinó per acumulació d'hipòtesis no observables. Cada salt afegeix incertesa: arquitectura, hardware, utilització, overhead, PUE i repartiment del cost entre múltiples tasques o usuaris.
Quan un proveïdor no publica telemetria per consulta, l'analista reconstrueix el cost energètic des de fora. Aquesta feina pot ser intel·lectualment seriosa i, tot i així, continuar sent una especulació informada.
El problema és acumulatiu: si cada pas introdueix un marge raonable, l'error total pot créixer fins a tornar inútil la comparació comercial o regulatòria.
AISHA: quan una xifra energètica depèn de massa supòsits invisibles, deixa de ser una dada operativa i passa a ser una conjectura sofisticada. L'objectiu regulatori no ha de ser endevinar millor, sinó mesurar millor.
Mateixa categoria
Wed Apr 01 2026 00:00:00 GMT+0200 (Central European Summer Time)
Anàlisi d'incentius econòmics i estratègics darrere de la manca de transparència.
Wed Apr 01 2026 00:00:00 GMT+0200 (Central European Summer Time)
What can already be measured, what standards are missing, and how regulatory demands fit in.
Wed Apr 01 2026 00:00:00 GMT+0200 (Central European Summer Time)
Qué cambiaría si el mercado tuviera métricas comparables de consumo por servicio y modalidad.