算力租赁&Token工厂:差异是什么,共性又是什么?
最近关于Tokens工厂/Tokens分成的讨论变多了,其实核心就是下面两件事儿
-NVIDIA GTC 2026(3/17):黄仁勋正式定义"Token工厂"概念,发布Vera Rubin平台,Token吞吐量较Hopper提升35倍,三年指引万亿美元需求
-阿里成立ATH事业群(3/16):CEO吴泳铭亲自挂帅,国内首次将Token上升为集团级战略,构建"创造→输送→应用Token"完整闭环
但目前市场对Token工厂的研究整体还在讨论分成模式这件事儿上,只看到了回本周期要缩短,利润要变高,但不知道怎么把英伟达的卡转化成Tokens定价,我搜集了一圈行业信息,把这个事情好好的盘了一下,到底应该怎么算,商业角度发生了哪些变化。
简单来说:Token工厂相当于是从租房子给别人到自己开餐馆(猪脚饭),现在吃饭的人越来越多,现在的问题不是想开餐厅的人多,是能开餐厅的地方少,【大学食堂,初中高中小卖部】,就是Toekn工厂的定位。
这里咱们可以按1024台B300服务器来试着算一下这个事儿。首先要了解一件事儿,Token工厂是按Tokens数量去定价的,他来卖给小B或者C端。
Token工厂的收入完全取决于Token产出量(卖了多少份猪脚饭),核心驱动变量是“负载率”(店开多久,有多少客人)。现在Token工厂聊下来,按行业的分成比例粗算差不多是2.5元/1M Tokens(百万),终端价格差不多14.6/1M Tokens(平治昨天公告的平台价格),个人感觉按2.5算成本还是合理偏保守的。
收入测算公式:集群收入 = 单卡吞吐量 × 总卡数 × 年秒数(31,536,000) × 负载率 × GPU可用率 × Token到手单价 ÷ 1,000,000
B300单卡吞吐量官方宣称极限数量比B200提升20%-30%,目前我聊下来B200 FP4+优化的理论吞吐量应该在10,756 Tokens/s/卡(MLPerf v4.1数据,原文链接NVIDIA Blackwell架构与H200 GPU在AI推理中的性能突破-CSDN博客),就保守按12,000 Tokens /s/卡算即可,考虑到这里是极限性能(对应的是FP4精度 + 最大batch size + 极致优化的理论上限),且我这个数据主要是基于70B的模型,实际如果跑的模型大,Tokens的输出量应该会下降不少,比如跑671B的DeepSeek R1之类的。其次就是MLPerf是极限测试,实际环境还有调度开销、模型切换、网络延迟等问题会导致Tokens的产出减少,这里假设只有2/3的性能产出,按8,000 Tokens/s/卡算。
GPU可用率的因素要考虑的原因:以前租是按台租的,维护的时间也算钱,现在自己做工厂,维护的成本就到自己手上了,这里可以先假设考虑维护、升级、故障等因素后,实际可用率为90%(实际可能是95%,先这么算吧)。
负载率:现在是直接卖Tokens给用户或者小B,不像大厂规划都是用的满满的,这个负载肯定会有爬坡的时间,使用率越高,收入就越高,这里目标运营肯定都是100%负载,但是考虑到ToC和小B的稳定性,实际能有90%就很好了,我们可以先按目标90%去算第一版。
那么1024卡的一个集群营收=8,000 × 1,024 × 31,536,000 × 0.9 × 0.9 × 2.5 ÷ 1,000,000=41.85亿元/年
成本项:这里面有跟算力租赁一样的成本部分,也有跟算力租赁不一样的部分。首先是现在卡的使用权在自己这儿了,运维、备件、人力成本都要自己来,其次是需要开发调度平台,要买带宽,整体从成本是比算力租赁要更重的一些的。
初步找了些行业专家确认,成本项多了一些,运维人力差不多30万/人,按120人算,带宽整体算5000万/年,调度平台的模型适配研发,运维算4000万一年,然后维修/备件按3%的资本开支算,这里价格就算600万好了(现货650,但是买不到现货,期货会便宜些),那差不多1,024台的维修/备件成本在1.84亿/年。加上电费,IDC租赁单价这些成本,整体运营成本差不多是6.4亿,比直接甩手给别人差不多要多背个3-4亿/年(取决于公司运营的效率到底怎么样)。
如果这么算,会发现经营的利润率非常非常显著的提升了。如果按15%税率算,甚至一个集群有19.5亿净利润,净利率达到46.7%(润建董秘交流反馈有机会超过40%,数据相符),如果算负载是60%,净利润也超过了7.7亿每个集群,利润率达到了27.6%。所以这也是为什么说Token工厂出现和落地,可能会对行业带来非常大的利润率提升。
那么这里一定要引发讨论的是,算力租赁的利润看起来远不如Tokens工厂,那为什么还有人愿意做算力租赁呢?(开猪脚饭店赚钱,但房东不一定愿意开店是一样的道理)
答案就是收租稳定:算力租赁是5年长单,搞定一个客户有稳定的回款,资金压力小,确定性高,Token工厂需要自己找客户,更像一个分销商,万一收成不好,成本比租赁高的多;
整体来看,算力租赁景气度与Token工厂,都是很好很好的生意,只是一个更稳定,一个相对利润更高,从现阶段看,共同的特征就是这个生意等于在学校开小卖部,不管是学校出租还是自己干,都稳赚不赔,那难的地方在哪?拿到卡,有卡等于有店铺,你想干嘛都行,反正都有的赚,重点关注拿卡能力强的公司。
附业务模型供参考。
【有道云笔记】算力租赁&Token工厂:差异是什么,共性又是什么?
https://share.note.youdao.com/s/RbRzOW4J <br/>
<br/>
免责声明:本网站提供的所有数据及资讯(包括第三方机构提供的信息)仅作交流学习及参考用途,不构成任何投资建议或交易要约。