TokenLanding

怎样写 LLM API 文档,客户才信你的计量

鉴权、限速、Token 计费、错误语义与可复制示例;让技术买家一眼看懂表怎么跑。

2026-04

TL;DR

好的 LLM API 文档应覆盖鉴权、限速、Token 计费、错误语义和可复制示例。

先写计费模型

说明按 token、按次还是混合计价。若混合门面与性价比用量,链到 价格与分档策略。也可参考 如何控成本 而不毁掉体验。

给出真实请求与响应

可复制的 curl/SDK 样例降低支持成本;限流、上下文超限、无效密钥等错误要带补救说明。

用 token 定义上限,而不是只写字符

把最大提示与补全和 上下文窗口 对齐,便于集成方估长。

维护变更日志

模型升级与调价要有日期——和大厂云 API 一样建立信任。

Ready to cut your token bill?

Token Landing — hybrid AI tokens, Claude-class UX, saner spend

Related reading