Meta · Llama

Meta 的开源权重 LLM 家族 —— 唯一由超大规模厂商广告公司出货的前沿层模型线,没有原生 API 业务和行业最大披露的 GPU 机群。

1. 核心产品 / 服务

Llama 模型家族 —— Llama 1 (2023-02,泄漏然后部分开源)、Llama 2 (2023-07,带社区许可的开源权重)、Llama 3 (2024-04,然后 3.1 / 3.2 / 3.3)、Llama 4 (2025) 代,以及截至 2026 年开发中的 Llama 5 / 下一代线的报告。顶端的混合专家;Llama 4 引入了 "Behemoth" / "Maverick" / "Scout" 分层 SKU,跨越从设备上的小型到前沿级参数计数。
许可:Llama 社区许可协议 —— 带 可接受使用政策 + 7 亿月度活跃用户阈值,Meta 在此之上要求单独的商业许可的开源权重。对 ~99% 的开发者生态系统足够宽松,对 AWS / Google / Microsoft / TikTok 级平台足够严格,他们不能自由地商业化 Llama 作为其主要商业模型,除非有 Meta 协议。
Meta AI —— 集成到 Facebook、Instagram、WhatsApp、Messenger 和独立 Meta AI 应用中的消费者面向助手。由 Llama 驱动。这是 分发护城河 —— 不需要任何新应用即可触达数十亿用户。
Ray-Ban Meta + Quest —— 使用 Llama 衍生多模态模型的具身 AI 表面。
无 1P API 业务 —— Meta 不商业销售 Llama token。meta.com 没有 "Llama API" 端点。Llama 完全间接 货币化:Meta 自己平台上的广告定位 + 参与,加上通过 together-ai、DeepInfra、Groq、Fireworks、AWS Bedrock、Azure AI、openrouter 的第三方托管 —— 这些 Meta 都不抽成。

2. 目标用户与痛点

开源权重生态系统 —— 任何为成本 / 隐私 / 自定义原因运行自托管推理(通过 ai-inference-engines 的 vLLM / SGLang / TGI)的人。Llama 是西方生态系统中的默认开源权重选择(Mistral 和 DeepSeek/Qwen 拆分其余部分)。
3P 推理提供商 —— together-ai、DeepInfra、Groq、Fireworks 等在不为亚 7 亿 MAU 使用支付 Meta 许可的情况下将 Llama 作为产品货币化。Llama 是 L3b 层竞争的 商品供应。
Meta 自己 —— 通过 Facebook / Instagram / WhatsApp 中的 Meta AI 的数十亿消费者用户。

解决的痛点(对生态系统):闭源实验室的可信开源权重前沿替代方案,没有 DeepSeek / Kimi / Qwen 的中国起源地缘政治担忧。

3. 竞争格局

实验室	起源	开源权重?	前沿 API?
Meta · Llama	美国	是(社区许可)	无 1P API;仅 3P 分发
openai	美国	大部分否	是
anthropic	美国	否	是
google-deepmind	美国/英国	混合 (Gemma 开源)	是
mistral	法国	混合	是
deepseek	中国	是 (MIT + 许可)	是
kimi	中国	部分	是
qwen	Alibaba / 中国	是 (Apache 2.0)	是,通过阿里云

Meta 的定位在结构上独特:它是唯一其商业模式不需要 Llama 产生 token 营收的前沿层实验室。Meta 的 1500 亿美元+ 年营收来自广告;Llama 存在是为了 (a) 改善 Meta 自己的产品,(b) 商品化闭源 AI 竞争对手的护城河,(c) 吸引人才 / 开发者注意力。

4. 独立观察

前沿训练成本(Llama 4 / 5 级):Meta 在资本支出上是闭源阵营中 最透明的。Mark Zuckerberg 在 2024 年披露 Meta 将在 2024 年底部署大约 350,000 H100 等价 GPU,在更广 AI 算力机群中增长到 ~600,000 H100 等价。到 2025-2026 年,机群已经跨越了 100 万+ AI 加速器 标记,包括 B200 / Trainium 级增加。在这些数字下,单次前沿 Llama 4 级训练可能 数百万到 ~10 亿美元算力摊销,Llama 5 进一步扩展。即使 Meta 不发布每模型数字,这也是 前沿支出。
API 定价 —— 顶级 SKU:N/A —— 没有 Meta Llama API。最接近"list 价格"的是在第三方推理提供商上运行 Llama 的成本。参考价格 (2026-05):together-ai / DeepInfra / Fireworks 上的 Llama 3.3 70B / Llama 4 大型 MoE 落在 $0.20-$0.90/M 输入 · $0.30-$0.90/M 输出 区间 —— 西方栈中最便宜的开源权重前沿选项。Meta 直接捕获 该营收的零。
定价 vs 估计单位成本 —— 毛利率信号:这是批次中最扭曲的条目,因为 Meta 不将 Llama 定价为 token 产品。~$0.50/M 输出的 3P 市场价格由 Together / DeepInfra / Fireworks / Groq 之间的竞争压力设定 —— 他们都没有支付训练成本。Meta 在 Llama 上的有效"利润率"最好测量为 (FB/IG/WA 中 Meta AI 的广告营收提升)+(对 OpenAI / Anthropic 利润率造成的商品化损害)−(训练 + 推理资本支出)。前两项很大且增长;第三项每年数百亿美元。这种权衡是否合算是战略问题,而不是单位经济问题。
开源 vs 闭源策略 + 理由:完全开源权重(社区许可)。Zuckerberg 在股东信和开源 AI 宣言(2024)中反复声明的理由:(a) 商品化模型层,以防止任何单一闭源竞争对手控制 Meta 产品依赖的 AI 基底;(b) 吸引开发者 + 研究注意力,以保持 Meta 的 ML 人才管道强大;(c) 利用外部审查 + 社区贡献的安全 / 能力。战略逻辑与 OpenAI / Anthropic 相反 —— 这些实验室需要闭源权重来货币化 token;Meta 需要开源权重,以便没有其他人控制 Meta 必须为之付费的闭源 token 垄断。
无 API 业务 —— 商业含义:这是行业中最干净的测试,看 分发是否胜过基础模型的货币化。Meta 在 Llama 基建上花费比除 OpenAI / Stargate 之外的任何西方实验室都多,且不赚取直接 token 营收。如果 (a) FB/IG/WA 中的 Meta AI 实质性提升广告营收,以及 (b) 商品化的开源权重生态系统防止任何单一闭源竞争对手提取 Microsoft 式平台租金,则赌注得到回报。截至 2026 年,两者都是早期阶段的声明。
垂直整合 —— 自有 DC,以 NVIDIA 为锚,Trainium 实验:Meta 运营 自己的超大规模数据中心机群(与 AWS / Azure / GCP 一起是世界四大之一),为 Llama 训练 + 推荐系统工作负载专门构建。硬件:NVIDIA H100 / H200 / B200 锚(2024 年披露的 ~350k+ H100 建设),由 Meta 自己的 MTIA(Meta 训练和推理加速器)定制硅芯片补充,用于推理重度推荐工作负载(以增长规模部署)。这是 任何前沿实验室在 Google 之外最深的 L3 → L1 垂直 —— Meta 拥有建筑、网络、电源,部署 NVIDIA + 定制硅芯片,在自己的 DC 上运行行业最大的训练作业。比较:OpenAI Stargate(在建)、xAI Colossus(快速建设,单一站点)、Anthropic(无 DC)、DeepSeek(无 DC,租用 High-Flyer 购买的 H800)、Google(完整 TPU + DC + 晶圆代工合作伙伴,最接近的同业)。
广告 vs 研究证明:Meta 全年资本支出在 2024 年约 370 亿美元,在 2025 年实质性增加(宣布的 2025 年资本支出指引在 600-650 亿美元+ 范围)。该增加的 大多数 是 AI 基建 —— 既为 Llama 训练 + Meta AI 推理,也为驱动 Reels / FB / IG 广告营收的推荐系统。广告营收增长(2024 Q4 ~480 亿美元+ Meta 总营收,2025 年继续在 400-500 亿美元/季度区间)为其提供资金。这是 AI 中 最大的单一证明飞轮:广告为算力付费,算力训练 Llama + 推荐模型,这些模型提升广告。没有其他前沿实验室拥有这个循环。

5. 财务 / 融资

母公司 / 结构:Meta Platforms Inc. (NASDAQ: META)。Llama 未单独融资 —— 完全内部 R&D,在 FAIR(Meta AI 研究)加上 GenAI 产品团队下。
2024 营收:~1640 亿美元(全年)。2025 年继续增长轨迹。
2025 资本支出指引:600-650 亿美元+ 范围,AI 加权。
GPU 机群披露:2024 年底 350k H100 等价(Zuckerberg 公开声明),到 2025 年更广 AI 机群增长到 600k+ H100 等价,通过 2025-2026 年添加 B200 / Trainium / MTIA。
Llama 特定营收:0 美元(无 API)。间接营收(归因于 Meta AI 的广告提升)未单独披露。

6. 团队与关系

CEO:Mark Zuckerberg。
首席 AI 科学家 (FAIR):Yann LeCun —— 开源 AI 的长期公开倡导者。
GenAI 产品领导:Ahmad Al-Dahle(VP GenAI),Joelle Pineau(FAIR Labs 负责人,之前)。
离开去 AI 实验室的著名校友:Guillaume Lample + Timothée Lacroix(创立 mistral),许多前 FAIR 研究人员遍布行业。
硬件合作伙伴:NVIDIA (H100 / H200 / B200 锚)、AMD(选定工作负载的 MI300X)、TSMC(MTIA 晶圆代工合作伙伴)、Broadcom(网络)。
分发 (3P,无 Meta 抽成):together-ai、DeepInfra、Fireworks、Groq、AWS Bedrock、Azure AI、openrouter、Hugging Face。
竞争对手(闭源):openai、anthropic、google-deepmind、xai。
竞争对手(开源权重):deepseek、kimi、qwen、mistral —— Llama 锚定但不独家拥有的开源权重生态系统。