Human-in-the-Loop AI
Human-in-the-Loop(HITL) AI 系统把自动化 AI 处理与人类监督和干预结合起来,尤其针对复杂、高风险或情感敏感的决策。
核心概念
模型
AI 处理常规情况(80-90%)
↓
复杂/边缘情况 → 人类专家审核
↓
人类决策反馈进 AI 训练
↓
AI 随时间改进
何时使用 HITL
| 场景 |
HITL 方法 |
| 高复杂度 |
AI 分类 → 人类解决 |
| 高情感敏感度 |
人类处理升级 |
| 关键决策 |
需要人类批准 |
| 合规 |
人类审计追踪 |
| 训练数据生成 |
人类标签改进 AI |
Crescendo:GC 的旗舰 HITL 投资
概览
| 属性 |
值 |
| 创立 |
2023 |
| 融资 |
总计 $50M |
| 估值 |
$500M |
| 创始人 |
Anand Chandrasekaran(前 GC 合伙人)、Hemant Taneja(GC CEO) |
| 领投方 |
General Catalyst |
业务模式
目标市场:$741B 全球客服外包市场
价值主张:
- AI 处理 80-90% 常规客服
- 人类专家处理复杂/高情感案例
- 每次人类交互训练 AI
- 基于结果的定价(非按小时或按人头)
扩张:
- 第一年内收购 PartnerHero
- 业务覆盖六大洲
技术架构
客户查询 → AI 分类
↓
[简单] → AI 响应
[复杂] → 人类队列
↓
人类解决
↓
反馈到 AI 模型
其他 HITL 实现
Portia AI
GC 投资组合公司($4.4M 种子):
human::agent 接口用于 agent 控制
- 规划 agent 生成需要人类批准的动作计划
- 执行 agent 在预设节点暂停等人类输入
- 开发者可配置批准触发器
传统应用
| 行业 |
HITL 用例 |
| 医疗 |
AI 辅助诊断 → 医生确认 |
| 金融 |
欺诈检测 → 人类审核标记交易 |
| 法律 |
文档审核 → 律师批准 |
| 内容审核 |
AI 标记 → 人类审核 |
| 自动驾驶 |
AI 驾驶 → 人类接管能力 |
好处
对企业
| 好处 |
解释 |
| 成本降低 |
AI 处理量;人类处理价值 |
| 质量保证 |
人类监督防止 AI 错误 |
| 可扩展 |
处理峰值无需按比例招聘 |
| 合规 |
受监管行业的审计追踪 |
对 AI 系统
| 好处 |
解释 |
| 持续学习 |
人类决策成为训练数据 |
| 边缘情况处理 |
人类解决新问题 |
| 偏见检测 |
人类识别有问题的 AI 输出 |
挑战
运营
| 挑战 |
缓解 |
| 延迟 |
异步交接、清晰 SLA |
| 成本 |
优化 AI 准确率降低人类量 |
| 培训 |
人类需要理解 AI 系统 |
| 一致性 |
标准化升级标准 |
技术
| 挑战 |
缓解 |
| 交接时机 |
ML 模型预测升级需求 |
| 上下文转移 |
给人类的丰富案例总结 |
| 反馈循环 |
结构化人类标注工具 |
市场背景
为什么是现在?
- LLM 能处理 80%+ 常规互动
- 剩余 20% 是高价值、复杂案例
- 全球劳动力成本上升
- 客户对即时响应的期望
竞争格局
| 公司 |
方法 |
| Crescendo |
全栈:AI + 人类劳动力 |
| Forethought |
AI 优先支持平台 |
| Kustomer |
CRM + AI 路由 |
| Ada |
AI 自动化与人类备份 |
未来趋势
- AI 处理更多 —— 人类比例随时间下降
- 人类角色转变 —— 从执行到监督/训练
- 专门化 —— 人类聚焦情感智能、谈判
- 实时协作 —— AI 建议,人类决定
相关
- crescendo —— GC 的 HITL 平台
- general-catalyst —— 主要 HITL 投资者
- ai-customer-service —— 更广市场