Transparència / Opacitat

Inventari forense d'opacitat energètica

Mapa de quins proveïdors publiquen dades, quins no i amb quina qualitat metodològica.

L'evidència pública continua sent mínima i molt desigual

A abril de 2026, gairebé tot el debat sobre consum energètic d'IA descansa sobre un grapat de mesuraments de laboratori, una sola xifra granular de producció i diverses estimacions corporatives o acadèmiques amb marges d'error elevats. El problema principal no és la manca d'interès: és la manca de telemetria oberta i comparable per servei.

Fonts primàries realment útils

10

Entre papers, benchmarks oberts, declaracions corporatives i estimacions auditables.

Rang públic per a una consulta de text

0,24-0,34 Wh

Google i OpenAI marquen l'estret tram conegut de referència per a xat general.

Desviació màxima observada

x 27

Les cadenes d'estimació opaques poden disparar la diferència entre la dada inferida i la real.

Aquest inventari separa mesurament directe, dades de producció i estimació indirecta per respondre una pregunta simple: què sabem de veritat i què continuem suposant.

La conclusió és incòmoda: la majoria de xifres que circulen a la premsa, la regulació i el màrqueting no són telemetria verificable. Són aproximacions construïdes sobre hardware suposat, utilització estimada i models propietaris que continuen tancats.

Consum per modalitat amb l'evidència disponible avui

Escala logarítmica basada en el rang públic més citat per a text, generació d'imatge i vídeo open source.

Conclusió: el problema central ja no és calcular un número bonic, sinó distingir entre telemetria real i narrativa especulativa. Sense aquest tall, qualsevol comparació entre models continua sent fràgil.

Les 10 peces que realment sostenen el debat

Aquest bloc reuneix les fonts que de veritat aporten alguna cosa al debat energètic: mesurament directe en laboratori, un cas de producció granular i un petit conjunt d'estimacions acadèmiques o corporatives que, fins i tot amb límits, ajuden a fitar ordres de magnitud.

Inventari d'evidència primària

Filtra per tipus per distingir producció real, laboratori obert i estimació indirecta.

		Valor reportat	Troballa clau
Google — mediana de Gemini Agost 2025 · arXiv:2508.15734v1	Producció	0,24 Wh / consulta	Única xifra granular de producció publicada amb TPU, overhead de host i PUE inclosos.
Sam Altman — ChatGPT Juny 2025 · blog corporatiu	Estimació	0,34 Wh / consulta	Serveix com a referència mediàtica, però arriba sense metodologia, peer review ni desglossament per modalitat.
Hugging Face AI Energy Score Desembre 2025 · Sasha Luccioni et al.	Directa	1 a 5 estrelles	Compara més de 200 models oberts i mostra que el raonament pot disparar el consum fins a centenars de vegades.
ML.Energy (University of Michigan) 2025-2026 · Jae-Won Chung et al.	Directa	Leaderboard obert	Dona context útil per a models open source, però no resol la caixa negra dels proveïdors tancats.
The Hidden Cost of an Image Juny 2025 · arXiv:2506.17016	Directa	Fins a x46 entre models	Confirma l'enorme dispersió energètica en imatge i la poca utilitat de comparar per marca sense context tècnic.
Video Killed the Energy Budget Setembre 2025 · arXiv:2509.19222	Directa	Fins a x2.000 vs text	El vídeo open source ja marca una ruptura física clara: la modalitat importa més que el màrqueting del model.
Àudio generatiu Maig 2025 · arXiv:2505.07615	Directa	Varia per model	És gairebé l'única referència empírica útil per a text-to-audio i deixa fora les plataformes comercials dominants.
How Hungry is AI? 2025 · arXiv:2505.09598	Estimació	o3: 39,2 Wh · Claude 3.7: 17 Wh	Bona foto d'escenaris possibles, però continua sent inferència teòrica basada en preus i supòsits de hardware.
Simulació Monte Carlo bottom-up Setembre 2025 · arXiv:2509.20241	Estimació	Mediana 0,34 Wh	És una de les millors aproximacions acadèmiques, però depèn de massa hipòtesis d'entrada no observables.
Claude Code energy estimate Gener 2026 · Simon P. Couch	Estimació	41 Wh / sessió mediana	Útil per dimensionar agents, tot i que el propi autor reconeix un marge d'error proper a x3.

La taula resumeix troballes comparables. El detall llarg i les limitacions metodològiques continuen estant a les fonts originals.

Producció verificable

Google és l'única gran plataforma que ha publicat una xifra granular de producció comparable.
Aquesta dada ja demostra que el mesurament per consulta sí que és tècnicament viable.
Continua faltant el més sensible: agents, vídeo comercial i desglossaments per servei premium.

Laboratori obert

L'acadèmia i l'open source sí que permeten mesurar text, imatge, àudio i vídeo sota condicions controlades.
Aquest univers serveix per entendre ordres de magnitud, no per substituir telemetria de producte real.
Els models tancats dominants continuen fora de la comparativa pública.

Estimació indirecta

Les estimacions més citades barregen hardware suposat, utilització incerta i costos financers com a proxy.
Poden orientar una discussió, però no sostenir regulació fina ni comparació comercial justa.
Com més opac és el proveïdor, més gran és el marge d'error.

Quines dades continuen absents als grans proveïdors

L'opacitat no és homogènia. Hi ha un buit especialment greu en agents, vídeo comercial, inferència agregada i càrregues distribuïdes dins de plataformes tancades. Aquesta taula documenta quina informació clau continua sense publicar-se i on ja hi ha rebuig explícit o silenci sostingut.

Inventari de dades encara desconegudes

Filtra per proveïdor per veure quins forats d'informació continuen oberts.

	Dada que falta	Estat
OpenAI Text (GPT-5)	Consum real per consulta	Sense dades
OpenAI Imatge (DALL-E / GPT-4o)	Consum real per imatge	Sense dades
OpenAI Vídeo (Sora 2)	Consum per clip en producció	Sense dades
OpenAI Agent (Deep Research)	Consum real per sessió	Sense dades
Anthropic Text (Claude)	Consum real per consulta en producció	Sense dades
Anthropic Agents (Claude Code / Research)	Consum real per sessió automatitzada	Sense dades
Google Agent (Gemini Deep Research)	Consum real per sessió	Petició rebutjada
Google Vídeo (Veo 2/3)	Consum per clip en producció	Sense dades
Meta Inferència integrada	Consum agregat d'IA a Facebook, Instagram i WhatsApp	Sense dades
xAI Text (Grok 4)	Consum real i emissions de Colossus	Sense dades
Plataformes musicals Suno / Udio	Qualsevol dada empírica pública	Sense dades
Vídeo comercial Runway / Pika / Kling	Qualsevol dada empírica pública	Sense dades

L'absència de dades no significa absència de telemetria interna. Significa absència de publicació útil per a clients, reguladors o investigadors.

Què revela aquesta taula

L'opacitat més greu ja no està en l'entrenament, sinó en la inferència comercial recurrent: agents, vídeo, eines integrades en suites de productivitat i consum agregat de plataformes amb milers de milions d'usuaris.

El fet que Google hagi pogut publicar una mediana per consulta i, alhora, rebutjar dades més concretes per a serveis intensius mostra que la barrera és selectiva. Es comparteix el suficient per marcar relat, no el suficient per permetre comparació.

Els productes amb més fricció regulatòria potencial són els menys transparents.
Els agents continuen sent l'angle més opac i estratègicament sensible del mercat.
Sense dades per servei, la conversa pública es desplaça a mitjanes agregades poc útils.

Si la indústria coneix el consum exacte per gestionar capacitat, preus i límits d'ús, llavors l'absència de publicació no és ignorància: és estratègia.

Com es fabrica una xifra quan no existeix mesurament directe

Les estimacions bottom-up no fallen per mala fe individual, sinó per acumulació d'hipòtesis no observables. Cada salt afegeix incertesa: arquitectura, hardware, utilització, overhead, PUE i repartiment del cost entre múltiples tasques o usuaris.

Quan un proveïdor no publica telemetria per consulta, l'analista reconstrueix el cost energètic des de fora. Aquesta feina pot ser intel·lectualment seriosa i, tot i així, continuar sent una especulació informada.

El problema és acumulatiu: si cada pas introdueix un marge raonable, l'error total pot créixer fins a tornar inútil la comparació comercial o regulatòria.

1. Paràmetres actius

Els models propietaris MoE no revelen quants experts s'activen per token.
La xifra total de paràmetres no serveix si no sabem quanta arquitectura s'usa en cada resposta.
Error de partida: pot anar de x2 a x10.

2. Hardware assumit

H100, H200, B200 o TPU canvien radicalment el cost per FLOP.
Sense visibilitat del clúster real, qualsevol estimació arrenca amb el silici equivocat.
Desviació típica: 50%-100%.

3. Utilització real

El mateix hardware canvia molt si està al 10%, 30% o 60% d'utilització.
L'economia del batch i del scheduling és una caixa negra per a l'observador extern.
Aquí l'error pot créixer a x3-x5.

4. FLOPs per consulta

La fórmula estàndard no captura bé routing, atenció, caching ni altres optimitzacions propietàries.
Dos prompts amb el mateix nombre de tokens poden no costar el mateix.
La desviació pot anar de 30% a x2.

5. Conversió a energia

Usar TDP màxim o consum mitjà canvia molt el resultat final.
A més, els clústers de producció processen en paral·lel amb eficiències impossibles de veure des de fora.
El biaix addicional pot arribar a 50%.

6. Overhead del sistema

GPU no és el mateix que node complet: CPU, xarxa, memòria i emmagatzematge també consumeixen.
Google va documentar que el seu accelerador representa només el 58% del total.
Aquí apareix un altre salt de 50%-100%.

7. PUE i context del centre de dades

El mateix workload canvia si opera amb PUE 1,09 o 1,5 i amb diferent refrigeració.
Els clústers densos d'IA tenen dinàmiques tèrmiques que no sempre encaixen amb el PUE històric del proveïdor.
Últim marge: 10%-50%.

AISHA: quan una xifra energètica depèn de massa supòsits invisibles, deixa de ser una dada operativa i passa a ser una conjectura sofisticada. L'objectiu regulatori no ha de ser endevinar millor, sinó mesurar millor.

Fonts

Mateixa categoria