Product
Azure OpenAI Service
微软的 OpenAI 模型 hosted 入口 —— 物理上和 OpenAI 共用底层算力(甚至有时反过来,OpenAI 用 Azure),靠企业合规 + 区域部署 + 投资关系吃下 GPT 在 enterprise 的最大份额。
1. 核心产品 / 服务
Azure OpenAI Service(AOAI)是 OpenAI 模型 唯一非-OpenAI 自营的官方分发渠道,以及微软在 L3b 的旗舰产品。
- 模型菜单:GPT-5 系列(GPT-5, GPT-5-Pro, GPT-5-Mini, GPT-5-Nano,与 OpenAI 同步发布)、GPT-4o / GPT-4o-mini / GPT-4.1、o3 / o4-mini / o3-mini、DALL-E 3、Whisper、TTS、text-embedding-3-large/small。
- Deployment types:Standard(共享 pay-per-token)、Provisioned Throughput Units (PTU)(预留 capacity、按小时计费、低延迟保证)、Global Standard / DataZone Standard(跨区域路由优化吞吐价格)、Batch(async, 50% 折扣)。
- 企业 features:Azure Active Directory 集成、Customer-managed keys、private endpoints、VNet 集成、Azure Policy compliance, GDPR / HIPAA / FedRAMP High。
- AI Foundry / Azure AI Studio:上层 RAG / agent / fine-tuning 框架,把 OpenAI 模型 + Azure 数据服务 + Microsoft Graph (Office 365) 黏合。
- Microsoft 自家模型: Phi-4 系列、自训 Mistral 等也在 AOAI 同一入口下;Azure AI Foundry 还托管 Llama / DeepSeek / Mistral / Cohere(这部分类似 Bedrock / Vertex),但 AOAI 这个产品名严格指 OpenAI / Microsoft 模型。
2. 服务对象 & 痛点
- 微软 Office / Azure 大客户:已经在 Azure 上跑数据 + 用 Microsoft 365 Copilot,AOAI 是合同顺延;不会跑去签 OpenAI 直供。
- 欧洲 / 受监管区域企业:OpenAI 直接 API 历史上不全区域可用 / 数据驻留不灵活;AOAI 提供 EU / UK / Australia / Canada 等区域专门 deployment + data residency 承诺。
- 大型政府 / 国防:Azure Government Cloud 上有 GPT —— OpenAI 直接 API 无对应通道。
- 痛点:合规审批 + 区域驻留 + 已有 Azure 合同 → 是 AOAI 优于 OpenAI 直连的三大原因。
3. 竞争格局
| Competitor | Positioning | Vs. AOAI |
|---|---|---|
| OpenAI 直接 API | 1P 直供 | 价格几乎 parity,但 OpenAI 直供模型 first 拿到、AOAI 滞后数周到几个月;企业合规通常推 AOAI |
| aws-bedrock | Anthropic Claude 主场 | 镜像对位:Bedrock = AWS+Claude, AOAI = Azure+GPT |
| gcp-vertex | Google Gemini + Claude + Mistral | Vertex 多模型 hedge;AOAI 死磕 GPT |
| together-ai / fireworks-ai | 3P 开源 token API | 价位低;但 GPT 不可替代 |
差异化:OpenAI 模型独家非自营分发 + Azure AD/合规生态 + Office 365 Copilot 流量底座。
4. 独特观察
- Per-token 定价(Standard,2026-05):
- GPT-5: $1.25/M input + $10/M output — 与 OpenAI 直供 parity
- GPT-5-Mini: $0.25/M input + $2/M output — parity
- GPT-5-Nano: $0.05/M input + $0.40/M output — parity
- GPT-4o: $2.50/M input + $10/M output — parity
- GPT-4o-mini: $0.15/M input + $0.60/M output — parity
- o3-mini: $1.10/M input + $4.40/M output — parity [1]
- vs 1P 价差(take rate):严格价格 parity,take rate 名义上为 0%。微软通过其他维度回收价值:
- Microsoft 持有 OpenAI 49% 经济权利(公开报道)—— OpenAI 在 Azure 上跑 GPT 训练 + 推理产生大量算力支出,回流 Azure 收入;
- Office 365 / Microsoft 365 Copilot 把 GPT 包成 $30/月/seat 的 SKU,take rate 在应用层(不在 AOAI 层);
- AOAI 客户必然伴随 Azure 其他服务支出(存储 / 网络 / 数据),这些服务 take rate 实际更高。
- vs 第三方:OpenAI 模型在 AOAI 之外没有任何合法 token API 渠道——这是和 Bedrock / Vertex 不一样的"硬独家"。Bedrock 上 Claude 同样可在 Vertex / Anthropic 直供拿;但 GPT 离开 OpenAI / AOAI 没有 plan B。
- 推理引擎:未公开 — 视为 OpenAI 自家 stack(Triton / 自研)+ Azure NDv5 / NVIDIA H100 / H200 / B200 GPU pool。Microsoft 也部分使用自研芯片 Maia 100(2024 launch)跑部分 AOAI workload,是 hyperscaler 自研芯片摊薄推理成本的另一案例。
- 算力来源:100% Azure 自家数据中心 — 微软对 OpenAI 投了 ~$130 亿+,配套大量 H100 capacity 给 OpenAI training + AOAI inference。OpenAI 训练 GPT-5 用的就是 Azure GPU;推理服务器同时给 OpenAI 直供 + AOAI 共享 capacity。
- Take rate 隐藏机制:OpenAI 在 Azure 上的算力支出 ≈ 微软给 OpenAI 折扣 GPU rental ≠ 市场价。微软 + OpenAI 的财务结构相互纠缠,token API "parity 定价"只是表象 — 实际利润分成由两家私下条款决定。
- 滞后 launch:GPT-4o 发布后 AOAI 滞后 ~1-2 周;某些 niche 功能(Realtime API, fine-tuning 早期版本)AOAI 滞后更久。这是企业用户 vs OpenAI 直供的 trade-off:合规换尝鲜速度。
- 战略 risk:OpenAI / Microsoft 关系 2024-2026 多次紧张(OpenAI 探索其他云、Stargate 项目把 OpenAI 拉去 Oracle / SoftBank);如果 OpenAI 重新协商把 GPT 多云化,AOAI 的"硬独家"叙事破裂。
5. 财务 / 业务规模
- GA 时间: 2023-01
- 微软对 OpenAI 投资: 累计 ~$130亿+(含算力补贴、现金);Microsoft 持有 OpenAI 经济权益(49% 利润分配,至特定回报上限)。
- AOAI 收入: 微软不单独披露,但 2024 财报多次提"AI 业务超 $130亿 ARR"主要由 Copilot + AOAI 驱动。
- 客户: 60,000+ Azure OpenAI 企业客户(自报);含 Coca-Cola, Mercedes, Moody's, ICRC, KPMG, Unilever, BMW, US Army (CoPilot Air Force)。
6. People & Relationships
- Parent: Microsoft Azure,Satya Nadella (CEO Microsoft)、Scott Guthrie (EVP Cloud + AI)。
- Strategic partner: OpenAI — Sam Altman, Greg Brockman;OpenAI 主要算力消费方与 Azure 互为绑定。
- Microsoft 自家 AI 团队: Mustafa Suleyman(CEO Microsoft AI,2024 加入;DeepMind / Inflection 创始人之一)、Microsoft Research / Phi 团队。
- Competes with: aws-bedrock, gcp-vertex, OpenAI 直接 API(内部"友竞"), together-ai / fireworks-ai (在开源模型 tier)。
- Hosts models from: OpenAI(GPT 全系 + DALL-E + Whisper + Embeddings), Microsoft(Phi 系列), AOAI 同一 portal 还含 Llama / DeepSeek / Mistral / Cohere / xAI Grok 等(位列 Azure AI Foundry 而非 AOAI 严格菜单)。
Sources
- [1] https://azure.microsoft.com/en-us/pricing/details/cognitive-services/openai-service/ (2026-05-10)
- [2] https://azure.microsoft.com/en-us/products/ai-services/openai-service (2026-05-10)
- [3] https://news.microsoft.com/2023/01/23/microsoftandopenaiextendpartnership/ (2026-05-10)
- [4] https://learn.microsoft.com/en-us/azure/ai-services/openai/ (2026-05-10)
Last compiled: 2026-05-10