开云世界杯(中国)有限公司 放浪扩产的“Token工场”: 营收数十倍增长, 一场场成本狂欢正在演出! 投资东谈主: 存在一定泡沫迹象
发布日期:2026-06-19 08:11 点击次数:168

当大模子竞赛从“参数武备”转向“应用落地”,一个避讳而高增长的底层生意正在浮出水面——“Token工场”(把东谈主工智能才气拆解成最基础的计量单元“Token词元”,像自来水厂雷同按需供应)。
6月16日,国内AI(东谈主工智能)推理处事企业“硅基流动”官宣完成超20亿元B轮融资,创下2026年以来国内第三方MaaS(模子即处事)赛谈最大单笔融资记载。《逐日经济新闻》记者了解到,这家诞生不及三年的企业,昔日一年日均Token微辞量达数万亿量级,营收同比涨超十倍,还曾在11个月内连获三轮融资,成为一级市集炙手可热的方向。
无特有偶,5月,同赛谈企业无问芯穹、魔形智能纷繁晓喻融资。其中,无问芯穹再获超7亿元融资,累计融资额超22亿元。为止4月底,无问芯穹AgenticMaaS大模子处事平台的日均Token调用量相较于客岁底已增长超20倍。
成本狂热加码的另一面,头部互联网大厂全面落地自研推理算力与MaaS处事、全行业API(应用程序编程接口)订价堕入尖锐化竞争、端侧轻量化模子抓续分流云霄Token调用需求。多重挤压之下,“Token工场”广泛堕入业务领域高速延迟、盈利空间不断收窄的矛盾阵势,如何走出增收不增利的困局成为赛谈中枢议题。

产业成本扎堆入局“Token工场”
成AI落地中枢赛谈
一笔20亿元级融资,将“Token工场”赛谈再次推至聚光灯下。
据硅基流动官方泄漏,本轮融资由携程战投、晶科动力控股、金蝶股份、联通新沃、盛奕成本(津润集团产业成本)、壁仞战投、蔚来成本、商汤战投、巨东谈主收罗等二十余家机构纠合投资。至此,硅基流动已获取动力、芯片、算力基础设施、云处事、大模子及场景应用等AI全产业链企业投资,产业成本在本轮融资中占比显赫普及。
这并非赛谈首笔大额融资。本年5月,同赛谈玩家无问芯穹刚完成超7亿元融资;外洋市荟萃,FireworksAI诞生四年宗旨估值达150亿好意思元,日处理Token领域15万亿。短短一年时间,“Token工场”已从AI产业链角落措施,跃升为一级市集的中枢赛谈。
成本热捧的底层逻辑,是AI需求结构的根人道切换。
大模子才气每迈上一个台阶,就解锁一大类应用,应用反过来又普及了底层Token铺张量。据国度数据局干总共据,2024年头中国日均Token调用量为1000亿;至2025年底跃升至100万亿;本年3月已冲破140万亿,两年增长超千倍。
寰宇知名究诘机构IDC最新发布的《中国AI软件市集半年度跟踪,2025H2》数据浮现:2024年中国企业级MaaS市集调用量仅114万亿Token,2025年跃升至1944万亿Token,同比增长约16倍;2025年公有云MaaS市集领域达30.7亿元,增速远超AI行业举座水平。Agent智能体普及、多模态应用落地、行业数字化转型三大趋势,仍在抓续推高Token铺张领域。
IDC预测,2026年中国MaaS市集的Token铺张量将达到40000万亿,较2025年再增约20倍。
从交易模式实验来看,Token工场并非浅显的算力转售,中枢是将芯片适配、模子部署、推理引擎调优、异构算力调解等复杂工程才气,抢庄牛牛APP官网下载封装为模范化API接口。客户按需调用、按量付费,省去了企业自建集群、组建运维团队的重干与,大幅镌汰了AI落地的手艺门槛与成本周期。
面对海量的市集需求爆发,大领域、高性价比Token的郑重供应,正成为影响AI手艺领域化落地的要津才气。
天神投资东谈主、资深东谈主工智能群众郭涛汲取《逐日经济新闻》记者采访时示意,从“卖模子”到“卖Token”是AI产业交易化的迫切演进。Token看成大模子处理信息的最小单元,具备可计量、可订价、可交游的性情,将AI智能才气改造为可模范化交游的巨额商品,措置了AI才气难以量化的行业痛点,股东行业从定制化处事模式转向模范化、领域化变现模式,经久来看这门生意具备较好的可抓续性。
中金公司研报浮现,“Token工场”模式已成为寰宇大模子厂商的主流交易化旅途,外洋头部企业Anthropic年度陆续性收入冲破300亿好意思元。盈利层面,面前外洋头部大模子API业务毛利率广泛在40%至50%,国内大模子厂商MaaSAPI业务毛利略低于外洋,预测本年将达到20%至40%,跟着领域效应开释与手艺优化,经久仍有上行空间。

大厂下场、API价钱战尖锐化⋯⋯
“Token工场”盈利承压
不外,头部企业营收十倍增长的亮眼数据背后,赛谈隐忧恒久存在。跟着互联网大厂下场布局、API价钱战尖锐化,“Token工场”的交易模式界限与增长天花板正被再行凝视。
大厂躬行下场是最胜仗的行业变量。
6月8日,开云2026世界杯中国官网阿里巴巴晓喻组织架构调养,将通义大模子职业部与翌日生活实验室整合,诞生全新TokenFoundry职业部,由集团CEO(首席实施官)吴泳铭胜仗风雅。此前3月,阿里诞生ATH(AlibabaTokenHub)职业群,仍是喊出了“创造Token、运输Token、应用Token”的中枢宗旨。
将Token坐褥普及至集团计谋级,背后是大厂对推理处事进口价值的重估:Token产能既是复古自己电商、云处事、土产货生活等业务AI化的基础,亦然阿里云对外输出MaaS处事的中枢产能。
郭涛合计,大厂全面入场后,孤立第三方“Token工场”仍有生涯空间。他向记者示意,大厂虽有手艺、资源和生态上风,但市集需求种种且复杂,难以遮蔽扫数领域和场景。孤立第三方可聚焦特定垂直领域提供个性化、定制化处事,或深耕特定手艺优化,针对某类模子或场景普及Token生成后果与质地。此外,部分企业出于数据安全、幸免过度依赖单一厂商的考量,也会采取与孤立第三方互助。
API价钱战抓续尖锐化,则是面前“Token工场们”濒临的最胜仗盈利压力。
自2023年以来,头部大模子厂商已累计十余次下调API价钱,部分主流模子千Token价钱从率先的数毛钱降至几分钱,累计降幅超90%。短缺中枢优化才气、仅靠算力差价盈利的中间商型玩家已率先堕入亏本。
开云kaiyun中国官网入口本年5月,DeepSeek官方晓喻V4-Pro模子API长久降价,举座降幅75%,百万Token输出价钱为6元。随后,小米、腾讯云纷繁跟进,小米旗下MiMo-V2.5系列API长久降价,最高降幅达99%,Pro版订价与DeepSeekV4-Pro十足对皆。腾讯云自6月3日0时起,对DeepSeek-V4系列模子调用价钱进行大幅下调,最高降幅达到97.5%,调养后价钱全面抓平DeepSeek官方售价。
业内广泛合计,若“Token工场”后果普及的速率跟不上价钱下跌速率,交易模式的可抓续性将胜仗濒临挑战。
此外,端侧AI的快速普及,则从需求端分流市集。随入部属手机、PC(个东谈主电脑)等终局拓荒的端侧大模子才气升级,无数轻量级推理任务向端侧挪动,无需调用云霄Token。行业广泛预测,翌日30%至50%的推理需求将在端侧完成,尽管高复杂度、多模态、长高下文的中枢推理需求仍依赖云霄,但端侧分流无疑收窄了云霄“Token工场”的举座增长天花板。
与此同期,头部客户自建推理集群的趋势也在蚕食第三方市集份额。金融、动力、政务等数据明锐型行业出于合规考量,更倾向私有化部署;头部互联网企业跟着业务领域扩大,自建算力集群的单元成本已低于第三方采购,纷繁转向自建。第三方“Token工场”的中枢客群,可能迟缓向中小企业、长尾应用与弹性需求场景会聚,市集定位濒临重构。
关于“Token工场”赛谈的泡沫争议,郭涛向记者示意,当今市集确乎存在一定泡沫迹象。无数成本涌入下,部分企业为追求领域盲目延迟,暴戾实验成本与盈利情况。但举座而言,AI发展是势在必行,Token经济看成其交易化要津模式有着信得过需求复古,仅仅市集需要经验调养与整合。
谈及破局旅途与行业终局,郭涛合计,“Token工场”可通过普及算力期骗后果、优化能耗镌汰运营成本,通过分级服求竣事相反化订价获取溢价,还可配套模子优化提倡、手艺支抓等升值处事拓展收入起头。
“经久来看,市集更可能变成多线索、相反化的竞争花样:头部大厂凭借实力占据通用型大领域市集,中小‘Token工场’凭借特点处事深耕细分领域,变成错位竞争,共同组成多元的市集生态。”郭涛示意。
记者|赵雯琪
裁剪|张锦河余婷婷杜恒峰
校对|程鹏开云世界杯(中国)有限公司