LLM Token 计数器是精确的吗？

它提供浏览器端快速估算。GPT 使用 o200k 风格近似，Claude 与 Gemini 使用各自模型族的近似规则。

是否支持很大的文本？

支持。大文本会在浏览器中异步处理，减少长文档导致页面卡顿的概率。

API 成本如何估算？

计算器会把估算 token 数乘以各模型每百万输入 token 单价，得到本次输入成本。

我的数据会被存储吗？

不会发送到服务器。所有计算均在浏览器本地完成，只会在同一设备的 localStorage 中保存最近输入。

LLM Token 计数器 - CalculatorBox

模型	Token 数	上下文占用	输入成本
Gemini 3.5 Flash	77	0.01%	$0.000027
Gemini 3.1 Pro	77	0.00%	$0.000193
Claude Opus 4.7	85	0.04%	$0.001275
Claude Sonnet 4.6	85	0.04%	$0.000255
GPT-5	80	0.02%	$0.0001
GPT-5 mini	80	0.02%	$0.00002

如何使用 LLM Token 计数器

LLM Token 计数器用于估算提示词、文档、代码、JSON、多语言文本在不同模型中的 token 数。将内容粘贴到文本框后，右侧结果会实时展示 Gemini 3.5 Flash、Gemini 3.1 Pro、Claude Opus 4.7、Claude Sonnet 4.6、GPT-5 和 GPT-5 mini 的 token 估算、上下文窗口占用百分比，以及对应输入 API 成本。

示例按钮可以帮助你快速理解不同内容类型的 token 差异。Wikipedia 示例接近普通文章；代码示例包含大量符号、括号和缩进，通常与自然语言的分词方式不同；PDF/RAG 示例模拟从 PDF 中抽取出来的文本，适合评估检索增强生成场景中“检索片段 + 用户问题”的输入规模。

预算反推区域可以从金额倒推容量。输入预算、选择货币，并设置每次请求大约多少 token，计算器会估算这笔预算能处理多少输入 token，以及能覆盖多少次请求。这适合批量总结、提示词评测、数据标注、知识库回填等任务。

公式与原理 - LLM Token 计数器

LLM Token 计数器采用透明的浏览器端估算规则。精确 token 数会受到各家 tokenizer、模型版本、文本规范化方式和特殊 token 的影响。为了在页面中快速比较，计算器使用如下近似：

英文 token 估算 ≈ 英文字符数 / 4
中文、日文、韩文估算 ≈ CJK 字符数 × 1.5
代码修正 ≈ 标点和语法符号数量 × 0.35
上下文占用百分比 = token 数 / 模型最大上下文窗口 × 100%

输入成本按 API 常见的每百万 token 定价方式计算：

输入 API 成本 =
  估算 token 数 / 1,000,000 × 模型输入单价

GPT 行使用接近 cl100k_base 与 o200k_base 的 GPT 风格估算；Claude 行会加入模型族修正；Gemini 行采用接近 SentencePiece 的估算思路，即 1 token 大约对应 4 个字符或 0.75 个英文单词。这些规则不是官方 tokenizer 的替代品，但足够用于预算、上下文规划和模型对比。

对于 100K 字符以上的大文本，计算器会通过 Web Worker 异步处理，避免主线程长时间阻塞。所有计算仍然在浏览器本地完成，不依赖后端 API。

使用场景 - LLM Token 计数器

LLM Token 计数器适用于任何 token 数影响成本、延迟或上下文容量的场景。提示词工程师可以比较不同 prompt 版本；开发者可以判断 JSON、代码文件或检索片段是否能放进 GPT-5、Claude 或 Gemini；内容团队可以在批量总结文章库前估算预算。

在 RAG 系统中，它能帮助决定每次检索应放入多少上下文：上下文太少可能影响答案质量，太多则增加延迟和成本。在代码助手中，它能估算一次请求能容纳多少文件。在多语言产品中，它能提醒团队：中文、日文、韩文与英文文本的 token 关系并不完全一致。

页面内链连接到 LLM API 成本计算器和 AI 模型上下文窗口对比器，形成完整工作流：先统计 token，再判断是否放得下，最后估算每日和每月成本。

LLM Token 计数器