Company

Cohere

多伦多的企业 AI 实验室 —— 围绕 RAG / Embed 领先地位和有意的 B2B 优先、无消费者应用战略构建。

1. 核心产品 / 服务

  • Command 模型家族 —— Cohere 的文本生成模型。Command R、Command R+、Command A(最大企业层旗舰)。长上下文(128k+)、原生工具调用 + 引用,针对 RAG 工作流优化。比 OpenAI / Anthropic 前沿更小且专门调优 —— 不在原始前沿质量上竞速。
  • Embed 模型家族 —— Embed v3 / v4。Cohere 的旗舰贡献;生产 RAG 栈中使用最多的非 OpenAI 嵌入模型。多语言、高质量,在更低成本下与 OpenAI text-embedding-3-large 竞争。
  • Rerank 模型家族 —— Cohere Rerank,生产 RAG 的事实标准交叉编码器重排器。被一长串搜索 / RAG / agent 公司用作第二阶段评分器。
  • North —— Cohere 的企业 AI 平台 / agent 产品,2024–2025 年发布,将 Command + Embed + Rerank 捆绑到私有部署知识工作助手中。
  • Aya —— Cohere For AI 研究分支发布的开源权重多语言研究模型。

分销:cohere.com 的 1P API,加上 AWS Bedrock、Google Cloud Vertex、Oracle OCI、Azure(选择性)。

2. 目标用户与痛点

  • 受监管企业 —— 金融服务、医疗保健、政府、国防 —— 需要私有部署(VPC、本地、主权云)且不能通过 OpenAI / Anthropic 路由数据的买家。
  • RAG / 搜索构建者 —— 任何运行生产检索增强生成的人都会寻找 Cohere Embed + Rerank 作为一流的非 OpenAI 组件。
  • 多语言工作负载 —— Cohere 专门投资了非英语覆盖(Aya 项目),这与以美国为中心的 OpenAI / Anthropic 有所区别。

解决痛点:企业采购友好的 RAG 栈、私有部署故事、多语言质量。

3. 竞争格局

实验室 前沿模型? RAG / embed 领先地位 企业渠道
Cohere 否(有意) 是 —— Embed v3/v4、Rerank 直接 + Bedrock + Vertex + OCI
openai text-embedding-3 系列 Azure
anthropic 没有原生嵌入 Bedrock + Vertex
mistral 接近前沿 Mistral Embed(份额较小) Azure + Bedrock + Vertex
Voyage / Jina / Nomic 仅 Embed 专家 API + 开源权重

Cohere 的定位一直是"企业 / RAG 专家,而不是前沿模型竞争者"。这是创立时的有意战略选择 —— 它同时是其差异化器和其商业上限。

4. 独立观察

  • 前沿训练成本:Cohere 不训练前沿规模模型 —— Command 系列按设计落后 GPT-5 / Claude Opus / Gemini Ultra 一层。单次训练算力可能位于 $10M–$50M 区间(更接近 Mistral 而非 OpenAI)。Cohere 的押注一直是前沿质量不是企业 RAG 买家需要的;他们需要的是一个足够强、能很好处理引用、工具调用和私有部署的模型。这个押注是否能在 2025 年后的前沿压缩(DeepSeek + Qwen + Llama 在开源权重上交付接近前沿质量)中存活,是存在性问题。

  • API 定价 —— 顶级 SKU:Command R+ / Command A 定价在 $2.5/M 输入 · $10/M 输出 区间(按 Cohere 世代变化;查阅定价页)。Embed v4 定价在 $0.10–$0.15/M token 区间,与 OpenAI text-embedding-3-large 竞争。Rerank 按每搜索查询计费($/1k 搜索)。定价将 Cohere 定位在 Command 上 Mistral 和 Claude Sonnet 之间,Embed 上 OpenAI 处于或略低于

  • 定价 vs 估算单位成本 —— 毛利率信号:Cohere 的 Command 级模型比 GPT-5 / Claude Opus 小,所以每 token 边际推理成本在绝对数上更低。在标价下,直接 API 的毛利率可能在 75–85% 区间。战略利润率压力来自 OpenAI text-embedding-3 在 Embed 一侧打折,加上开源嵌入模型(BGE、E5、Voyage)将较低层商品化。

  • 开源 vs 闭源战略:生产 Command 模型是闭源权重。Cohere For AI(研究分支)发布开源权重研究版本(Aya 等)作为社区 + 招聘玩法,而不是商业线。模式匹配 OpenAI gpt-oss / Google Gemma / xAI Grok 1 —— 发布非前沿权重集作为善意,保持生产闭源。

  • 近期裁员 / 转向:2024–2025 年报道记录了 Cohere 的多轮战略重组 —— 焦点明确转向企业 / North 产品 / 主权部署,远离与 OpenAI / Anthropic 的更广泛的开发者 API 竞争。这次转向伴随员工人数减少。叙事解释:Cohere 让出了横向开发者 API 竞争给 OpenAI / Anthropic,将剩余资源集中在其企业 + RAG 定位仍能胜出的垂直行业。

  • Embed 领先地位:这是 Cohere 拥有的最具防御性的资产。Embed v3 / v4 是 Pinecone、Weaviate、Qdrant、MongoDB Atlas Vector Search 和大多数企业 RAG 剧本中向量 DB 和 RAG 文档中被引用最多的非 OpenAI 生产嵌入模型。即使 Command 线趋于平稳,Embed + Rerank 业务也是真正的经常性收入引擎,不需要前沿算力来维持。

  • 垂直整合:无。Cohere 不拥有 DC 或硅片。它在 Oracle Cloud (OCI)、AWS、Google Cloud 和 Azure 上服务 —— Oracle 是值得注意的战略关系,OCI 作为首选部署表面。Cohere 是本批次实验室中最不垂直整合的 —— 它纯粹在 L3 竞争。

5. 财务 / 融资

日期 轮次 金额 估值
2019 创立(多伦多)—— Aidan Gomez、Ivan Zhang、Nick Frosst
2021 Series B $40M
2022 Series C $125M $2.2B
2023-06 Series C 扩展(Inovia / Index) $270M $2.2B
2024-07 Series D(PSP Investments / Cisco / Fujitsu / NVIDIA) $500M $5.5B
2025 跟投 / 战略 报道追加资本 报道 $5.5B+
  • 累计筹资:到 2024 年累计约 $1B+。
  • 营收(报道):根据 The Information 和其他报告,Cohere 2024–2025 年化营收在低数亿区间,实质上小于 OpenAI / Anthropic,但较低的算力支出使单位经济学可服务。
  • 投资方包括 NVIDIA 战略 —— 重要,因为 Cohere 是 NVIDIA 在股权结构表上的唯一主要前沿相邻实验室。

6. 团队与关系

  • 联合创始人 / CEO:Aidan Gomez —— 在 Google Brain 的原始"Attention Is All You Need" Transformer 论文(2017)的联合作者。
  • 联合创始人:Ivan Zhang。
  • 联合创始人:Nick Frosst(也领导 Cohere For AI 研究分支,业余时间是音乐家)。
  • 投资方:Inovia、Index Ventures、Tiger、NVIDIA、Oracle、Cisco、Fujitsu、Salesforce Ventures、PSP Investments、EDC、Radical Ventures。
  • 战略 / 云合作伙伴:Oracle (OCI)、AWS、Google Cloud、Azure、Fujitsu(日本)。
  • 竞争对手openai(特别是在 Embed 上)、anthropicmistral,加上嵌入专家(Voyage、Jina、Nomic)和开源权重实验室(deepseekkimi、Qwen、Meta Llama)。
Last compiled: 2026-05-10