如何使用 LLM Token 计数器
LLM Token 计数器用于估算提示词、文档、代码、JSON、多语言文本在不同模型中的 token 数。将内容粘贴到文本框后,右侧结果会实时展示 Gemini 3.5 Flash、Gemini 3.1 Pro、Claude Opus 4.7、Claude Sonnet 4.6、GPT-5 和 GPT-5 mini 的 token 估算、上下文窗口占用百分比,以及对应输入 API 成本。
示例按钮可以帮助你快速理解不同内容类型的 token 差异。Wikipedia 示例接近普通文章;代码示例包含大量符号、括号和缩进,通常与自然语言的分词方式不同;PDF/RAG 示例模拟从 PDF 中抽取出来的文本,适合评估检索增强生成场景中“检索片段 + 用户问题”的输入规模。
预算反推区域可以从金额倒推容量。输入预算、选择货币,并设置每次请求大约多少 token,计算器会估算这笔预算能处理多少输入 token,以及能覆盖多少次请求。这适合批量总结、提示词评测、数据标注、知识库回填等任务。
公式与原理 - LLM Token 计数器
LLM Token 计数器采用透明的浏览器端估算规则。精确 token 数会受到各家 tokenizer、模型版本、文本规范化方式和特殊 token 的影响。为了在页面中快速比较,计算器使用如下近似:
英文 token 估算 ≈ 英文字符数 / 4
中文、日文、韩文估算 ≈ CJK 字符数 × 1.5
代码修正 ≈ 标点和语法符号数量 × 0.35
上下文占用百分比 = token 数 / 模型最大上下文窗口 × 100%
输入成本按 API 常见的每百万 token 定价方式计算:
输入 API 成本 =
估算 token 数 / 1,000,000 × 模型输入单价
GPT 行使用接近 cl100k_base 与 o200k_base 的 GPT 风格估算;Claude 行会加入模型族修正;Gemini 行采用接近 SentencePiece 的估算思路,即 1 token 大约对应 4 个字符或 0.75 个英文单词。这些规则不是官方 tokenizer 的替代品,但足够用于预算、上下文规划和模型对比。
对于 100K 字符以上的大文本,计算器会通过 Web Worker 异步处理,避免主线程长时间阻塞。所有计算仍然在浏览器本地完成,不依赖后端 API。
使用场景 - LLM Token 计数器
LLM Token 计数器适用于任何 token 数影响成本、延迟或上下文容量的场景。提示词工程师可以比较不同 prompt 版本;开发者可以判断 JSON、代码文件或检索片段是否能放进 GPT-5、Claude 或 Gemini;内容团队可以在批量总结文章库前估算预算。
在 RAG 系统中,它能帮助决定每次检索应放入多少上下文:上下文太少可能影响答案质量,太多则增加延迟和成本。在代码助手中,它能估算一次请求能容纳多少文件。在多语言产品中,它能提醒团队:中文、日文、韩文与英文文本的 token 关系并不完全一致。
页面内链连接到 LLM API 成本计算器和 AI 模型上下文窗口对比器,形成完整工作流:先统计 token,再判断是否放得下,最后估算每日和每月成本。