TokenLanding

什么是 LLM API token?

LLM API 用 token 计量与限制;它与字数不同,并直接影响账单。

2026-04

TL;DR

Token 是 LLM API 用于计费和限速的文本块(约 4 个字符),Token 数与字数不同,直接影响账单。

为什么不直接数字符或单词?

不同模型家族分词方式不同。英文粗略四字一 token,但代码、中文或长 URL 会更密或更疏。统一用 token,上限与账单才能和模型真实处理量对齐。

账单长什么样

常见账单分列输入与输出 Token。隐藏上下文——长 system 提示或检索片段——仍占 上下文窗口。所以「只发了一句」在开启 RAG 时也可能 prompt 很大。

混合产品与诚实披露

若把门面与性价比能力混在同一计量后,请用白话说明——见 混合分档披露范例

Ready to cut your token bill?

Token Landing — hybrid AI tokens, Claude-class UX, saner spend

Related reading