![]()
雷递网 雷建平 3月31日
智谱(HK:02513)今日正式发布2025年全年业绩,这是其上市后首份财报。智谱2025年营收7.24亿,较上年同期的3.12亿增131.9%。MaaS商业飞轮全面运转,MaaS API平台实现ARR 17亿(约2.5亿美元),同比提升60倍;且盈利能力大幅改善,MaaS API平台毛利率同比提升近5倍至18.9%。
![]()
智谱的收入分为云端部署收入和本地化部署收入两部分,其中,智谱2025年云端部署收入为1.9亿元,较上年同期的4850万元增长292.6%;此项增长主要归因于集团通过持续迭代提升了模型智能上界。提升后的模型智能表现推动了模型调用量的增加。
![]()
智谱2025年本地化部署收入为5.34亿元,较上同期的2.64亿元增长102.3%,此项增长主要得益于本集团通过持续迭代提升模型智能上界,模型通用性的增强和市场的需求维持强劲。
智谱2025年毛利为3亿元,较上年同期的1.76亿元增长68.7%;智谱2025年综合毛利率41%。MaaS商业飞轮全面运转,MaaS API平台实现ARR 17亿元(约2.5亿美元),同比提升60倍;且盈利能力大幅改善,MaaS API平台毛利率同比提升近5倍至18.9%。
智谱首次定义AI生产力价值——Token架构力(Token Architect Capability),即“智能调用量 × 智能质量 × 经济转化效率”。
智谱CEO张鹏表示:智能上界的提升,是大模型AGI时代唯一的“第一性”。2026公司将进一步探索智能上界的突破,引领范式创新以及作为底座持续输出高质量Token。
前十大互联网公司中,有9家深度调用GLM模型
AI公司Anthropic凭借指数级增长,印证API商业模式的潜力。智谱的商业化路径与Anthropic高度一致,即以模型智能为核心壁垒,以API为主要产品形态。
2025年,智谱凭借GLM系列在“智能上界”侧的代际领先与推理侧的极致成本优化,实现了从开发者生态到全球化的全面爆发。
智谱旗舰基座模型GLM-5发布后24小时内,即获得字节跳动TRAE、阿里巴巴Qoder、腾讯CodeBuddy、美团CatPaw、快手万擎、百度智能云及WPS Office等头部平台产品的官方接入。
智谱称,目前中国前十大互联网公司中,有9家深度调用GLM模型。截至2026年3月,智谱的平台注册企业及用户突破400万,服务全球超过218个国家及地区。
Claw Plan上线20天订阅用户就破40万
此外,2025年智谱在国内第一家推出GLM Coding Plan(编程套餐),凭借模型的高质量编码能力,全球付费开发者数量快速突破24.2万,Token调用量6个月涨了15倍。
2026年2月,即使上调价格30%并取消首购优惠,编程套餐依然保持供不应求的态势,成为全球增长速度最快的AI编程服务之一。
2026年3月,继Coding Plan之后智谱推出Claw Plan,上线仅两天订阅用户即破10万,上线20天订阅用户突破40万。
目前,GLM模型已全面部署于Google Vertex AI、AWS Bedrock、Fireworks、Cerebras等全球顶尖云服务商,并入驻OpenRouter、Vercel等国际主流模型聚合平台。
GLM已成为国际知名Coding平台(如Windsurf)、知名CodingAgent平台(如OpenCode)的默认模型。当前,智谱已成为国内付费Token消耗量最高的厂商之一。
实现“量价齐升”
2025年,智谱完成从氛围编程(Vibe Coding)到智能体工程(Agentic Engineering)的迁移。GLM-4.5、4.6、4.7到GLM-5、5-Turbo的高频发布,在全球模型中仅次于GPT、Claude和Gemini。
此外,GLM-5在Artificial Analysis Intelligence Index榜单达到50分,这是开放权重模型首次达到这一高分。
此外,智谱推出的Slime框架实现异步强化学习效率革命,配合自研算法让模型从超1万个真实软件工程环境高效学习,支撑起全球首款OpenClaw基座模型GLM-5-Turbo的诞生。
同时,GLM-5完成国产芯片软硬协同设计,通过创新量化策略将显存占用压缩至极限,单台国产服务器即可稳定部署,成本降低50%,在国产芯片上实现比肩国际顶级芯片的推理效率,构建起“智能上界+自主计算底座”的技术闭环。
智谱称,凭借超强模型效果,在2026年一季度API涨价83%后,调用量不降反升,市场依然供不应求。这一“量价齐升”的态势,显示出客户为更确定的生产力付费的高度意愿。
未来聚焦高质量Token输出
中国AI需求加速扩张,模型能力成为核心竞争要素。
智谱称,2026智能范式将从轻量化的 Vibe Coding(氛围编程)向工业级的 Agentic Engineering(智能体工程)演变,再进化为具备自主规划、环境感知与自我迭代能力的数字工程师,最终实现跨越多步迭代、具备逻辑一致性的 Long-horizon Task(长程任务)闭环执行,这将进一步带来智能上界的突破与 Token 调用的指数级增长。
当大模型具备长程任务执行的闭环能力后,核心竞争力将重塑为TAC(Token Architecture Capability,Token 架构能力)。TAC = 智能调用量 x 智能质量 x 经济转化效率。未来,衡量一个个体或组织价值的标准,不再是掌握了多少信息,而是其作为Token 架构师,在给定预算下构建复杂 Agent 系统并驱动大模型完成复杂Agent系统的自主运行。
智谱称,其目标是成为提升全社会TAC 的基础设施,让每一滴 Token 都能转化为可交付的经济增量。
雷递由媒体人雷建平创办,若转载请写明来源。