按目前公开数据,用H800 跑 DeepSeek‑V3 满载推理,可以给出一个区间化、可落地的测算(2026‑05 市场)。
1. 单卡满载产能(H800)
官方数据(V3/R1 生产集群,FP8/BF16、专家并行优化):
- Decode(生成)吞吐:14.8k token/s(输出)
- 输入 Prefill:73.7k token/s(这里主要算输出收益)
按24h 满负载、纯生成估算:
- 每秒:14,800 输出 token
- 每天:14,800 × 86,400 ≈1.28 × 10⁹ 输出 token/天(≈12.8 亿)
2. 当前市场定价(人民币,2026‑05)
主流公开 API 价格(DeepSeek‑V3 标准):
- 输入:≈1 元 / 100 万 token
- 输出:≈2 元 / 100 万 token
自建/代理实际成交常略低:输入 0.8–1.5,输出 1.6–3 元/百万。
3. 单卡理论日收入(满载)
只算输出(最值钱):
- 日输出:1.28 × 10⁹ token
- 折算百万:1,280 M-token
- 日收入(输出):1,280 × 2 元 =2,560 元/天
如果按行业常见输入:输出 ≈ 1:1再加上输入:
- 输入收入:1,280 × 1 元 ≈ 1,280 元/天
- 合计日收入 ≈ 3,840 元/卡/天
4. 成本(H800)
4.1 硬件折旧(自购)
- H800 市场价:≈ 60–80 万/卡(2026,国内含税)
- 按3 年折旧、无残值:
- 月折旧:600,000 ÷ 36 ≈16,667 元/月(取 60 万卡)
- 日折旧:16,667 ÷ 30 ≈556 元/天
4.2 电费+机房
- H800 功耗:≈ 350W
- 电价:0.6–0.8 元/度(普通IDC)
- 日耗电:0.35kW × 24h = 8.4 kWh
- 日电费:8.4 × 0.7 ≈5.9 元/天(可忽略)
4.3 运维/带宽
- 估算:≈ 50 元/卡/天(多卡集群可摊薄)
4.4 日总成本(单卡)
- 折旧 556 + 电费 6 + 运维 50 ≈612 元/天
5. 日净利润 & 回本周期
5.1 满载、全价 scenario(乐观)
- 日收入:3,840 元
- 日成本:612 元
- 日净利润 ≈ 3,228 元
- 回本周期(按 60 万卡):
- 600,000 ÷ 3,228 ≈186 天 ≈ 6.2 个月
5.2 保守 scenario(现实更接近)
考虑:
- 实际负载:70%(调度、队列、故障)
- 实际均价:输出1.6 元/百万、输入0.8 元/百万(竞争降价、折扣)
重算:
- 有效日输出:1.28e9 × 0.7 ≈ 8.96e8 token = 896 M-token
- 输出收入:896 × 1.6 ≈ 1,434 元
- 输入收入(1:1):896 × 0.8 ≈ 717 元
- 日收入 ≈2,151 元
- 日净利润:2,151 − 612 ≈1,539 元
- 回本周期:
- 600,000 ÷ 1,539 ≈389 天 ≈ 12.8 个月
5.3 悲观 scenario(内卷加剧)
- 负载 50%、输出 1 元/百万、输入 0.5 元/百万
- 日净利润可能降至500–800 元
- 回本周期:2–3 年(接近硬件折旧极限)
6. 结论(一句话)
- 理论满载、理想定价:单卡日净赚3,000+ 元,半年左右回本。
- 现实主流情况:单卡日净赚1,500 元上下,1 年~14 个月回本。
- 价格战+低负载:回本拉长到2–3 年,投资风险明显上升。