Product
GCP Vertex AI
Google 的 1P (Gemini) + 3P (Claude / Llama / Mistral) 多模型 token 入口 — 模型菜单最杂的 hyperscaler 平台,靠 Gemini + Anthropic 双线吃企业市场。
1. 核心产品 / 服务
Vertex AI Generative AI 是 GCP 在 L3b 的旗舰产品;同时 Vertex AI 还有 ML Ops 部分,本页聚焦 Generative AI / token API:
- Gemini 系列: Google 自家 1P — Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.5 Flash-Lite, Gemini 1.5 Pro, Gemini 1.5 Flash, Imagen 3 / 4 (image gen), Veo 3 (video gen), Lyria (music)。
- Anthropic Claude: Vertex 是 Claude 第二大托管渠道(仅次于 aws-bedrock)—— Claude Sonnet 4 / Opus 4 / Haiku 4.5 全在 Vertex 可调,价格通常 parity Anthropic 直供。
- Meta Llama 3 / 3.1 / 3.3 + Mistral Large / Mixtral + AI21 Jamba + DeepSeek R1 / V3 等开源 / 第三方 — 通过 Model Garden 入口。
- Imagen 3 / 4: Google 1P 图像生成。
- Inference modes: Standard pay-per-token、Provisioned Throughput、Batch(异步、~50% 折扣)。
- Vertex AI Agents / Agent Builder: 上层 agent / RAG 框架,集成 Google Search / BigQuery / Drive。
- 企业 features: VPC Service Controls、CMEK、IAM、Data residency 承诺、HIPAA / FedRAMP / SOC 2 / ISO 27001。
2. 服务对象 & 痛点
- GCP 大客户: 已用 BigQuery / GCS — 把 Gemini / Claude 留在 GCP 内更顺。
- Google Workspace 集成场景: Gemini in Workspace 同源;从 Workspace 拉数据走 IAM 简单。
- 多模型 hedging 客户: Vertex 是少有的"GPT 之外的所有顶级模型"集合 —— Gemini + Claude 同台是 Vertex vs Bedrock 的最大优势。
- 痛点: 等同 Bedrock —— 数据合规 / VPC 内部署 / 企业合同流程。
3. 竞争格局
| Competitor | Positioning | Vs. Vertex |
|---|---|---|
| aws-bedrock | Anthropic Claude 主场 + Nova 自家 | Bedrock 没有 Gemini;Vertex 兼有 Gemini + Claude |
| azure-openai-service | OpenAI GPT 独家 | Vertex 没有 GPT;这是 Vertex 唯一明显空缺 |
| Anthropic 直接 API | 1P 直供 | 价格 parity;Vertex 提供企业合规 |
| Google AI Studio | Gemini 直供(developer-first) | AI Studio 简单 / 免费 tier 友好;Vertex 是企业版 |
| together-ai / fireworks-ai | 3P 开源 token API | 价位低;但企业 IAM 弱 |
差异化:唯一同时持有顶级 1P 模型 (Gemini) + 顶级 3P 模型 (Claude) 的 hyperscaler 入口。模型菜单最 "AI 中立"。
4. 独特观察
- Per-token 定价(Standard,2026-05):
- Gemini 2.5 Pro: $1.25/M input + $10/M output(≤200K context;超过 200K 加价 2×)
- Gemini 2.5 Flash: $0.30/M input + $2.50/M output
- Gemini 2.5 Flash-Lite: $0.10/M input + $0.40/M output(超低端 budget tier)
- Claude Sonnet 4: $3/M input + $15/M output — 与 Anthropic / Bedrock 完全 parity
- Claude Opus 4: $15/M input + $75/M output — parity
- Claude Haiku 4.5: $1/M input + $5/M output — parity
- Llama 3.3 70B: ~$0.72/M(与 Bedrock 持平,略贵于 Together / Fireworks)
- Imagen 4:
$0.04/image standard、$0.08/image high-quality [1]
- vs 1P 价差(take rate):Claude 在 Vertex 与 Anthropic 直供 strict parity,take rate 名义为 0;和 Bedrock 一样靠生态绑定 + 投资分成回收(Google 也持有 Anthropic 大量股权 — 累计投资 $30亿+ 报道)。
- Gemini 是 Google 1P:vs OpenAI / Claude 直接对位,Gemini 2.5 Pro $1.25/M input 比 GPT-5 $1.25/M input 持平;Flash-Lite $0.10/M 是市场地板价同 GPT-5-Nano 持平。Google 把 Gemini Flash 系列定价激进,意在和 deepseek / Llama 开源 budget tier 抢夺 long-tail。
- vs 3P 同行:Vertex 的 Llama / Mistral / DeepSeek 价格通常略高于 Together / Fireworks(5-15%),但企业客户为 GCP 一站式 + IAM 整合愿意付溢价。
- 推理引擎:未公开。Gemini 跑在 Google 自家 TPU v5e / v5p / Trillium + 部分 NVIDIA H100;Claude / Llama / Mistral 主要 NVIDIA H100 / H200 + 少量 TPU 适配。Vertex 是少数有自家芯片 (TPU) 摊薄推理成本的玩家——和 Trainium (AWS), Maia (Microsoft) 形成"hyperscaler 自研芯片三连发"局面。
- 算力来源:100% GCP 自家数据中心;TPU 是 Google 14 年来持续 capex 的累积武器。Gemini 在 TPU 上的推理边际成本结构性低于跑在 NVIDIA 上的 GPT / Claude — 这是 Google 把 Gemini Flash-Lite 卖到 $0.10/M 仍然有毛利的物理基础。
- Anthropic 关系: Google 和 Amazon 同时是 Anthropic 大投资人 —— Anthropic 的"双 hyperscaler 同时绑定"策略让 Claude 在 Bedrock + Vertex 同时 first-class 可用,这是 OpenAI / GPT 和微软深度绑定路径外的另一种 hyperscaler 关系范式。
- 战略 risk:Gemini 模型实力如果落后 GPT-5 / Claude 4 太多,Vertex 会变成"主要靠 Claude 分发"的 me-too Bedrock;Vertex 也缺 GPT,所以"用 GPT 的客户"完全无法服务 — 这是 hyperscaler 模型结盟战中 Google 的主要弱点。
5. 财务 / 业务规模
- GA 时间: Vertex AI 2021-05;Generative AI on Vertex 2023-06。
- Google 对 Anthropic 投资: 累计 ~$30亿+(含 cloud 算力承诺);与 Amazon 形成"双 hyperscaler 投 Anthropic"格局。
- Google Cloud AI 收入: 未单独披露 Vertex;GCP 整体 2025-Q4 营收 ~$120亿/季度,AI 是主要增长贡献。
- 客户: Wendy's, Wayfair, Mercedes-Benz, Best Buy, Spotify, Shopify, Verizon, Mayo Clinic — 公开 Vertex case 偏零售 / 媒体 / 健康。
6. People & Relationships
- Parent: Google Cloud Platform — Thomas Kurian (CEO GCP), Sundar Pichai (CEO Alphabet)。
- Vertex AI 业务负责人: 多次重组;Burak Gokturk (前 GM AI products) 等。
- Google AI / DeepMind: Demis Hassabis (CEO DeepMind) — Gemini 模型团队,DeepMind 与 Google AI 合并后产生 Gemini 全系列。
- Strategic partners: Anthropic (投资 + Claude on Vertex)、Meta (Llama)、Mistral、AI21、DeepSeek。
- Competes with: aws-bedrock, azure-openai-service, OpenAI 直接 API, together-ai / fireworks-ai (在开源 tier)。
- Hosts models from: Google (Gemini, Imagen, Veo, Lyria), Anthropic (Claude), Meta (Llama), Mistral, AI21, deepseek, Cohere, Stability AI 等 — Model Garden 200+ 模型。
Sources
- [1] https://cloud.google.com/vertex-ai/generative-ai/pricing (2026-05-10)
- [2] https://cloud.google.com/vertex-ai (2026-05-10)
- [3] https://cloud.google.com/blog/products/ai-machine-learning/anthropic-claude-on-vertex-ai (2026-05-10)
- [4] https://cloud.google.com/vertex-ai/generative-ai/docs/model-garden/explore-models (2026-05-10)
Last compiled: 2026-05-10