Zhipu AI
北京的 LLM 实验室,清华大学的 spin-out —— 中国对齐政府程度最深的前沿实验室,拥有 GLM 模型家族和强劲的垂直 / 前端 agent 专精。
1. 核心产品 / 服务
Zhipu AI(智谱AI / 北京智谱华章科技)成立于 2019 年,作为清华大学的 spin-out。核心产品:
- GLM 模型家族 —— General Language Model 系列。GLM-4(2024)、GLM-4.5 / 4-Plus、2025 年的 GLM-5 一代,以及 kimi 实体竞争格局表中提到的 GLM 5.1,被认为是中国前沿级模型中的 前端 / GUI agent 领军。GLM-6 已在 2026 年预览 / 讨论。
- GLM-4V / GLM-4.5V —— 多模态视觉-语言变体。
- CogVideoX —— 开源权重视频生成模型线。
- CodeGeeX —— 编码专用模型(也作为 JetBrains / VSCode 插件分发)。
- 开源权重发布:GLM-4-9B、GLM-4-32B、ChatGLM 血脉、CogVideoX,全部在 Hugging Face 上以宽松(模型许可)条款发布。前沿 GLM-5 / 6 变体部分闭源。
- BigModel.cn / open.bigmodel.cn —— Zhipu 的商业 API 平台;OpenAI 兼容的 chat + embeddings + 图像 + 视频 + agent 端点。
- Qingyan(清言) —— 消费者聊天助手。
- AutoGLM —— Zhipu 的 agent 产品,聚焦自治 web / 手机 GUI 控制。
2. 目标用户与痛点
- 中国政府 + 国有企业(SOE)买家 —— Zhipu 的清华出身和与中国 AI 政策的明确对齐,使其成为部委 / SOE / 受监管部署的默认选择。这是 唯一 与 DeepSeek(独立)、Kimi(私募 VC)、Qwen(阿里商业)区分开的渠道。
- 中国本土开发者 —— BigModel API 是中国境内生产部署的自家(1P)商业路径。
- agent / 自动化构建者 —— AutoGLM 把 Zhipu 定位在 GUI-agent 利基,前端 / 浏览器 / 手机控制是用例。
解决的痛点:为国家部门提供政治洁净的中国前沿模型;前端 + GUI agent 专精,与 DeepSeek / Kimi / Qwen 的文本优先定位真正差异化。
3. 竞争格局
| 实验室 | 出身 | 权重开源? | 利基 |
|---|---|---|---|
| Zhipu | 清华 / 中国 | 混合(较旧 GLM 开源,前沿闭源) | 前端 / GUI agent + 政府渠道 |
| deepseek | 中国(幻方) | 是(MIT + license) | 成本 / 前沿级 |
| kimi | Moonshot / 中国 | 部分 | 长程 agent |
| qwen | 阿里 / 中国 | 是(Apache 2.0) | 最广 SKU 阵容,多模态 |
| Baidu Ernie / MiniMax | 中国 | 混合 | 国内聊天 / 多模态 |
Zhipu 在"AI 四小龙"(DeepSeek / Kimi / Qwen / Zhipu)内的定位:与中国政府最深度嵌入 —— 这既是护城河(锁定买家、政府背书),也是约束(不像 DeepSeek 那样能在开源宽松度或纯成本上竞争)。
4. 独立观察
前沿训练成本(GLM-5 / 6):未披露。Zhipu 的算力通路受美国对中国大陆 H100 / H200 出口管制限制,迫使依赖 H800 / H20(带宽受限的 NVIDIA 中国出口 SKU)以及越来越多的 国产中国加速器(华为 Ascend 等)。相对于美国实验室、甚至相对于 deepseek(通过幻方对冲基金的资金早期拿到大量 H800 队列)的算力劣势,意味着 GLM-5 级别的训练在次优硬件上很可能落在 几千万至低于亿美元 区间。DeepSeek 开创的"架构效率优先于蛮力"剧本对 Zhipu 更加相关。
API 定价 —— 顶级 SKU(GLM-4-Plus / GLM-5):BigModel.cn 把 GLM-4-Plus / GLM-5 列在 国内子人民币每 M token 档,换算大约 $0.5–$2/M 输入 · $1.5–$5/M 输出。这把 Zhipu 放在 DeepSeek 价格带 内,大幅低于美国闭源前沿实验室(OpenAI / Anthropic / Google)。中国境内对国内企业买家和政府采购进一步折扣。
定价 vs 估算单位成本 —— 毛利率信号:在更小的 MoE 活跃参数计数和受限但专属的 H800 / Ascend 队列下,每 token 边际推理成本与 DeepSeek 相当。在 ~$2/M 输出标价下,缓存命中 API 的毛利率合理推断在 60–80% 区间 —— 比美国实验室肥利润率低,因为价格底盘更低,但仍然有利可图。
开源 vs 闭源策略:混合,类似 mistral。ChatGLM-6B / GLM-4-9B / GLM-4-32B / CogVideoX 是开源权重,采用宽松(自定义模型许可,基本可商用)条款。前沿 GLM-5 / GLM-6 闭源变体 保留在 BigModel API 上货币化。战略逻辑与 Mistral 和 Qwen-Max 相同 —— 开放生态,在闭源顶层货币化。
中国政府 + 商业组合:Zhipu 被北京明确放置为国家信号支持的"六小龙"中国 AI 公司之一。国家支持基金(北京 AI 产业投资基金、杭州市、上海 AICityX、珠海高新区、成都高新区)都参与了 Zhipu 的轮次。这与 DeepSeek(由幻方私募)、Kimi(阿里 / 腾讯 VC)、Qwen(阿里子公司)结构上不同。对西方分析师而言,Zhipu 是中国 AI 政策执行地图上最简单的单一观察点。
美国制裁敞口:2025-01,美国商务部把 Zhipu 加入实体清单,理由是对军民融合关系的担忧。这限制美国原产技术对 Zhipu 的出口(最直接:NVIDIA 数据中心 GPU、先进光刻)。运营上,Zhipu 的算力路线图依赖(a)灰市 H800 / H20 供应,(b)向华为 Ascend / 国产硅片加速迁移。这是模型轨迹 最大的单一外部风险,也是 Zhipu 强调架构 / 效率而非规模的原因。
IPO 传闻:2024–2025 年的报道记录了 Zhipu 多轮 香港 / 上海科创板 IPO 投机,报道目标为 $1B+ 预 IPO 融资,IPO 后估值讨论在 $10B+ 区间。截至 2026-05,无 IPO 公开关闭,但 Zhipu 仍是最可能尝试上市的中国 AI 实验室(DeepSeek 由梁 / 幻方私有持有,无退出压力;Kimi 也仍是私募)。
垂直整合:基建上无。Zhipu 不拥有 DC 或硅片。它从中国超大规模云厂商(阿里云、腾讯云、百度云、华为云)租用容量,并越来越多地作为国家对齐举措部署在基于 Ascend 的集群上。
5. 财务 / 融资
| 日期 | 轮次 / 事件 | 金额 | 估值 |
|---|---|---|---|
| 2019 | 作为清华 spin-out 创立 | — | — |
| 2022 | Pre-A | — | — |
| 2023 | 多轮(腾讯、Sequoia China、高瓴、美团) | 报道累计 >$340M | 增长中 |
| 2024 | 多轮(阿里、Saudi Prosperity7、北京 AI 基金) | 报道 $400M+ | $2B+ |
| 2024–2025 | 国家基金轮次(北京 / 杭州 / 上海 / 珠海 / 成都) | 报道数亿美元 | 接近 $3B+ |
| 2025-01 | 美国实体清单指定 | — | — |
| 2025–2026 | 传闻 IPO 准备 | — | 报道目标 $10B+ |
- 累计融资:截至 2025 年累计披露 $1.5B+。
- 营收:未公开披露;估计低于亿美元 RMB 规模,政府 / SOE 合同是最大单一营收线。