Product

GCP Vertex AI

Google 的 1P (Gemini) + 3P (Claude / Llama / Mistral) 多模型 token 入口 — 模型菜单最杂的 hyperscaler 平台,靠 Gemini + Anthropic 双线吃企业市场。

1. 核心产品 / 服务

Vertex AI Generative AI 是 GCP 在 L3b 的旗舰产品;同时 Vertex AI 还有 ML Ops 部分,本页聚焦 Generative AI / token API:

  • Gemini 系列: Google 自家 1P — Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.5 Flash-Lite, Gemini 1.5 Pro, Gemini 1.5 Flash, Imagen 3 / 4 (image gen), Veo 3 (video gen), Lyria (music)。
  • Anthropic Claude: Vertex 是 Claude 第二大托管渠道(仅次于 aws-bedrock)—— Claude Sonnet 4 / Opus 4 / Haiku 4.5 全在 Vertex 可调,价格通常 parity Anthropic 直供。
  • Meta Llama 3 / 3.1 / 3.3 + Mistral Large / Mixtral + AI21 Jamba + DeepSeek R1 / V3 等开源 / 第三方 — 通过 Model Garden 入口。
  • Imagen 3 / 4: Google 1P 图像生成。
  • Inference modes: Standard pay-per-token、Provisioned Throughput、Batch(异步、~50% 折扣)。
  • Vertex AI Agents / Agent Builder: 上层 agent / RAG 框架,集成 Google Search / BigQuery / Drive。
  • 企业 features: VPC Service Controls、CMEK、IAM、Data residency 承诺、HIPAA / FedRAMP / SOC 2 / ISO 27001。

2. 服务对象 & 痛点

  • GCP 大客户: 已用 BigQuery / GCS — 把 Gemini / Claude 留在 GCP 内更顺。
  • Google Workspace 集成场景: Gemini in Workspace 同源;从 Workspace 拉数据走 IAM 简单。
  • 多模型 hedging 客户: Vertex 是少有的"GPT 之外的所有顶级模型"集合 —— Gemini + Claude 同台是 Vertex vs Bedrock 的最大优势。
  • 痛点: 等同 Bedrock —— 数据合规 / VPC 内部署 / 企业合同流程。

3. 竞争格局

Competitor Positioning Vs. Vertex
aws-bedrock Anthropic Claude 主场 + Nova 自家 Bedrock 没有 Gemini;Vertex 兼有 Gemini + Claude
azure-openai-service OpenAI GPT 独家 Vertex 没有 GPT;这是 Vertex 唯一明显空缺
Anthropic 直接 API 1P 直供 价格 parity;Vertex 提供企业合规
Google AI Studio Gemini 直供(developer-first) AI Studio 简单 / 免费 tier 友好;Vertex 是企业版
together-ai / fireworks-ai 3P 开源 token API 价位低;但企业 IAM 弱

差异化:唯一同时持有顶级 1P 模型 (Gemini) + 顶级 3P 模型 (Claude) 的 hyperscaler 入口。模型菜单最 "AI 中立"。

4. 独特观察

  • Per-token 定价(Standard,2026-05)
    • Gemini 2.5 Pro: $1.25/M input + $10/M output(≤200K context;超过 200K 加价 2×)
    • Gemini 2.5 Flash: $0.30/M input + $2.50/M output
    • Gemini 2.5 Flash-Lite: $0.10/M input + $0.40/M output(超低端 budget tier)
    • Claude Sonnet 4: $3/M input + $15/M output — 与 Anthropic / Bedrock 完全 parity
    • Claude Opus 4: $15/M input + $75/M output — parity
    • Claude Haiku 4.5: $1/M input + $5/M output — parity
    • Llama 3.3 70B: ~$0.72/M(与 Bedrock 持平,略贵于 Together / Fireworks)
    • Imagen 4: $0.04/image standard、$0.08/image high-quality [1]
  • vs 1P 价差(take rate)Claude 在 Vertex 与 Anthropic 直供 strict parity,take rate 名义为 0;和 Bedrock 一样靠生态绑定 + 投资分成回收(Google 也持有 Anthropic 大量股权 — 累计投资 $30亿+ 报道)。
    • Gemini 是 Google 1P:vs OpenAI / Claude 直接对位,Gemini 2.5 Pro $1.25/M input 比 GPT-5 $1.25/M input 持平;Flash-Lite $0.10/M 是市场地板价同 GPT-5-Nano 持平。Google 把 Gemini Flash 系列定价激进,意在和 deepseek / Llama 开源 budget tier 抢夺 long-tail。
  • vs 3P 同行:Vertex 的 Llama / Mistral / DeepSeek 价格通常略高于 Together / Fireworks(5-15%),但企业客户为 GCP 一站式 + IAM 整合愿意付溢价。
  • 推理引擎:未公开。Gemini 跑在 Google 自家 TPU v5e / v5p / Trillium + 部分 NVIDIA H100;Claude / Llama / Mistral 主要 NVIDIA H100 / H200 + 少量 TPU 适配。Vertex 是少数有自家芯片 (TPU) 摊薄推理成本的玩家——和 Trainium (AWS), Maia (Microsoft) 形成"hyperscaler 自研芯片三连发"局面。
  • 算力来源:100% GCP 自家数据中心;TPU 是 Google 14 年来持续 capex 的累积武器。Gemini 在 TPU 上的推理边际成本结构性低于跑在 NVIDIA 上的 GPT / Claude — 这是 Google 把 Gemini Flash-Lite 卖到 $0.10/M 仍然有毛利的物理基础。
  • Anthropic 关系: Google 和 Amazon 同时是 Anthropic 大投资人 —— Anthropic 的"双 hyperscaler 同时绑定"策略让 Claude 在 Bedrock + Vertex 同时 first-class 可用,这是 OpenAI / GPT 和微软深度绑定路径外的另一种 hyperscaler 关系范式。
  • 战略 risk:Gemini 模型实力如果落后 GPT-5 / Claude 4 太多,Vertex 会变成"主要靠 Claude 分发"的 me-too Bedrock;Vertex 也缺 GPT,所以"用 GPT 的客户"完全无法服务 — 这是 hyperscaler 模型结盟战中 Google 的主要弱点。

5. 财务 / 业务规模

  • GA 时间: Vertex AI 2021-05;Generative AI on Vertex 2023-06。
  • Google 对 Anthropic 投资: 累计 ~$30亿+(含 cloud 算力承诺);与 Amazon 形成"双 hyperscaler 投 Anthropic"格局。
  • Google Cloud AI 收入: 未单独披露 Vertex;GCP 整体 2025-Q4 营收 ~$120亿/季度,AI 是主要增长贡献。
  • 客户: Wendy's, Wayfair, Mercedes-Benz, Best Buy, Spotify, Shopify, Verizon, Mayo Clinic — 公开 Vertex case 偏零售 / 媒体 / 健康。

6. People & Relationships

  • Parent: Google Cloud Platform — Thomas Kurian (CEO GCP), Sundar Pichai (CEO Alphabet)。
  • Vertex AI 业务负责人: 多次重组;Burak Gokturk (前 GM AI products) 等。
  • Google AI / DeepMind: Demis Hassabis (CEO DeepMind) — Gemini 模型团队,DeepMind 与 Google AI 合并后产生 Gemini 全系列。
  • Strategic partners: Anthropic (投资 + Claude on Vertex)、Meta (Llama)、Mistral、AI21、DeepSeek。
  • Competes with: aws-bedrock, azure-openai-service, OpenAI 直接 API, together-ai / fireworks-ai (在开源 tier)。
  • Hosts models from: Google (Gemini, Imagen, Veo, Lyria), Anthropic (Claude), Meta (Llama), Mistral, AI21, deepseek, Cohere, Stability AI 等 — Model Garden 200+ 模型。

Sources

Last compiled: 2026-05-10