LLM Token 计数器

使用 LLM Token 计数器估算 GPT、Claude、Gemini 在文本、代码、JSON、多语言提示词中的 token 数、上下文占用和成本。

780.0K 次使用 最近更新 · 2026-05-20 本地运行 · 零上传
AD

如何使用 LLM Token 计数器

LLM Token 计数器用于估算提示词、文档、代码、JSON、多语言文本在不同模型中的 token 数。将内容粘贴到文本框后,右侧结果会实时展示 Gemini 3.5 Flash、Gemini 3.1 Pro、Claude Opus 4.7、Claude Sonnet 4.6、GPT-5 和 GPT-5 mini 的 token 估算、上下文窗口占用百分比,以及对应输入 API 成本。

示例按钮可以帮助你快速理解不同内容类型的 token 差异。Wikipedia 示例接近普通文章;代码示例包含大量符号、括号和缩进,通常与自然语言的分词方式不同;PDF/RAG 示例模拟从 PDF 中抽取出来的文本,适合评估检索增强生成场景中“检索片段 + 用户问题”的输入规模。

预算反推区域可以从金额倒推容量。输入预算、选择货币,并设置每次请求大约多少 token,计算器会估算这笔预算能处理多少输入 token,以及能覆盖多少次请求。这适合批量总结、提示词评测、数据标注、知识库回填等任务。

公式与原理 - LLM Token 计数器

LLM Token 计数器采用透明的浏览器端估算规则。精确 token 数会受到各家 tokenizer、模型版本、文本规范化方式和特殊 token 的影响。为了在页面中快速比较,计算器使用如下近似:

英文 token 估算 ≈ 英文字符数 / 4
中文、日文、韩文估算 ≈ CJK 字符数 × 1.5
代码修正 ≈ 标点和语法符号数量 × 0.35
上下文占用百分比 = token 数 / 模型最大上下文窗口 × 100%

输入成本按 API 常见的每百万 token 定价方式计算:

输入 API 成本 =
  估算 token 数 / 1,000,000 × 模型输入单价

GPT 行使用接近 cl100k_base 与 o200k_base 的 GPT 风格估算;Claude 行会加入模型族修正;Gemini 行采用接近 SentencePiece 的估算思路,即 1 token 大约对应 4 个字符或 0.75 个英文单词。这些规则不是官方 tokenizer 的替代品,但足够用于预算、上下文规划和模型对比。

对于 100K 字符以上的大文本,计算器会通过 Web Worker 异步处理,避免主线程长时间阻塞。所有计算仍然在浏览器本地完成,不依赖后端 API。

使用场景 - LLM Token 计数器

LLM Token 计数器适用于任何 token 数影响成本、延迟或上下文容量的场景。提示词工程师可以比较不同 prompt 版本;开发者可以判断 JSON、代码文件或检索片段是否能放进 GPT-5、Claude 或 Gemini;内容团队可以在批量总结文章库前估算预算。

在 RAG 系统中,它能帮助决定每次检索应放入多少上下文:上下文太少可能影响答案质量,太多则增加延迟和成本。在代码助手中,它能估算一次请求能容纳多少文件。在多语言产品中,它能提醒团队:中文、日文、韩文与英文文本的 token 关系并不完全一致。

页面内链连接到 LLM API 成本计算器和 AI 模型上下文窗口对比器,形成完整工作流:先统计 token,再判断是否放得下,最后估算每日和每月成本。

关于LLM Token 计数器的常见问题

LLM Token 计数器是精确的吗?

它提供浏览器端快速估算。GPT 使用 o200k 风格近似,Claude 与 Gemini 使用各自模型族的近似规则。

是否支持很大的文本?

支持。大文本会在浏览器中异步处理,减少长文档导致页面卡顿的概率。

API 成本如何估算?

计算器会把估算 token 数乘以各模型每百万输入 token 单价,得到本次输入成本。

我的数据会被存储吗?

不会发送到服务器。所有计算均在浏览器本地完成,只会在同一设备的 localStorage 中保存最近输入。