基准(标准文本)
0,30 Wh
历史参考基准,用于对比其他所有内容
可持续性
仪表盘,用于探索能耗、模型、模态、倍数和真实等价物。
本面板总结了原始报告的关键要点:不存在"AI能耗"这一单一数值。轻量级文本仍处于零点几 Wh 的范围内,而推理、智能体和视频已在完全不同的量级上运行。
基准(标准文本)
0,30 Wh
历史参考基准,用于对比其他所有内容
平均推理
35,4 Wh
迅速进入 100 倍数量级
视频生成
520 Wh
2026 年商业范围内的短片
代码智能体
85 Wh
含工具调用和大量上下文的长时会话
对数刻度。从文本到视频的跃升是指数级的。
气泡 = 近似参数规模。价格不总能很好地反映物理成本,但有助于观察趋势。
探索报告数据库:按模型、类别、能耗或倍数排序,并按模态筛选。
| 日常等价 | 来源 / 可信度 | ||||
|---|---|---|---|---|---|
| GPT-4o OpenAI | 文本与推理 | 0.3 Wh | x1 | 微波炉1秒 | Epoch AI |
| Gemini 1.5 Pro (Mediana) Google | 文本与推理 | 0.24 Wh | x0.8 | 微波炉1秒 | Google(直接) |
| Llama 3.1 8B Meta | 文本与推理 | 0.03 Wh | x0.1 | LED灯泡1秒 | ML.Energy |
| Llama 3.1 405B Meta | 文本与推理 | 1.4 Wh | x4.7 | 微波炉5秒 | ML.Energy |
| o3-reasoning (Consulta Larga) OpenAI | 文本与推理 | 39.2 Wh | x130.7 | 看电视30分钟 | Jegham et al. |
| DeepSeek-R1-Distill-70B DeepSeek | 文本与推理 | 4.6 Wh | x15.3 | 微波炉15秒 | 外推(x154) |
| Phi-4-reasoning-plus Microsoft | 文本与推理 | 15.4 Wh | x51.3 | 手机完整充电 | 直接测量(x514) |
| GPT-5-main OpenAI | 文本与推理 | 4.5 Wh | x15 | 微波炉15秒 | URI AI Lab |
| GPT-5-thinking OpenAI | 文本与推理 | 35 Wh | x116.7 | 2.5次手机充电 | Shaolei Ren (x5-x10) |
| GPT-5.4 OpenAI | 文本与推理 | 42 Wh | x140 | 看电视1小时 | 基于 API 成本估算 |
| Claude Opus 4.6 Anthropic | 文本与推理 | 12.5 Wh | x41.7 | 微波炉40秒 | 热估算 |
| Claude Sonnet 4.6 (Adaptive High) Anthropic | 文本与推理 | 18 Wh | x60 | 1.2次手机充电 | Thinking 使用分析 |
| Gemini 2.5 Flash Google | 文本与推理 | 0.15 Wh | x0.5 | 相机闪光灯 | |
| Gemini 3.1 Pro Preview Google | 文本与推理 | 8.5 Wh | x28.3 | 微波炉30秒 | v6 硬件估算 |
| Llama 4 Maverick (MoE) Meta | 文本与推理 | 0.8 Wh | x2.7 | 微波炉3秒 | 17B 有效参数类比 |
| Grok 4 (Gas Powered) xAI | 文本与推理 | 22 Wh | x73.3 | 高碳足迹 | Southern Env. Law Center |
| DeepSeek-V3.2 DeepSeek | 文本与推理 | 1.2 Wh | x4 | 微波炉4秒 | Sparse attention |
| DeepSeek-R1 (HW Ascend) DeepSeek | 文本与推理 | 33.6 Wh | x112.0 | 2次手机充电 | Jegham et al. |
| GPT-4o Image Auto OpenAI | 图像 | 9.5 Wh | x31.7 | LED灯泡1小时 | Scope3 |
| SDXL H100 Stability | 图像 | 1.64 Wh | x5.5 | LED灯泡10分钟 | HuggingFace AI Energy |
| Midjourney v7 Midjourney | 图像 | 12 Wh | x40 | 1次手机充电 | 社区估算 |
| AudioLDM Various | 音频 | 0.25 Wh | x0.8 | 微波炉1秒 | Passoni et al. |
| Suno v5.5 (Canción) Suno | 音频 | 25 Wh | x83.3 | 2次手机充电 | GPU 时间估算 |
| Sora 2 (Clip 10s) OpenAI | 视频 | 513 Wh | x1,710 | 1次洗衣机循环 | 上线后报告 |
| CogVideoX1.5-5B THUDM | 视频 | 944 Wh | x3,146.7 | 半次洗碗机循环 | MIT Tech Review |
| Veo 3 Standard (10s) Google | 视频 | 180 Wh | x600 | 电动汽车1公里 | 按成本估算 |
| Kling 3.0 (15s) Kuaishou | 视频 | 145 Wh | x483.3 | 电动汽车1公里 | 基础设施估算 |
| Claude Code (Sesión) Anthropic | 智能体/代码 | 41 Wh | x136.7 | 看电视30分钟 | Simon P. Couch |
| Devin 2.0 (Tarea) Cognition | 智能体/代码 | 120 Wh | x400 | 8次手机充电 | 效率较 v1 提升 +83% |
| Aider (Sesión) Various | 智能体/代码 | 9.8 Wh | x32.7 | 看电视10分钟 | Token 效率(105k) |
| OpenAI o3 Deep Research OpenAI | 智能体/代码 | 450 Wh | x1,500 | 接近1次洗衣机循环 | Artificial Analysis |
| Perplexity Deep Research Perplexity | 智能体/代码 | 85 Wh | x283.3 | 看Netflix1小时 | 按 308k tokens 外推 |
基准:0.30 Wh 为标准文本查询。
将抽象操作转化为直观等价物:手机充电次数、电视观看小时数、电动汽车行驶公里数或洗衣机运转次数。
估算总能耗
AISHA 解读:生成式视频、深度研究和长时间代理并非简单的“功能”。它们是架构和实质性支出决策。正确做法不是禁止它们,而是衡量何时值得启用。