路由会看的输入
- 用户可见任务 vs 后台任务
- 延迟 SLO 与降级档位
- 各产品面的安全/体验下限
对客户端的体验
对外仍保持 OpenAI 兼容 形态;内部可换模型而无须分叉 SDK。
文档与买家教育
本文的稳定定义可与 API 文档写法、帮助技术买家比较供应商 的页面一起使用。
在 OpenAI 兼容 API 背后,用策略驱动多模型选择与 A 档/性价比档分流。
TL;DR
策略驱动的路由层在 OpenAI 兼容 API 背后为每个请求选择最优模型,分流 A 档与性价比档。
对外仍保持 OpenAI 兼容 形态;内部可换模型而无须分叉 SDK。
本文的稳定定义可与 API 文档写法、帮助技术买家比较供应商 的页面一起使用。
Token Landing — hybrid AI tokens, Claude-class UX, saner spend