LLM API 成本计算器如何计算？

它会把输入 token 和输出 token 分别乘以各模型每百万 token 单价，再按日均调用次数和 30 天换算为月成本。

是否支持 Batch API 和 Context Caching 折扣？

支持。Batch API 会按 50% 折扣计算，Context Caching 会把缓存命中部分按正常输入价格的 10% 计算。

Gemini 3.1 Pro 的长上下文阶梯价格如何处理？

当平均输入 token 超过 200K 时，计算器会对 Gemini 3.1 Pro 应用长上下文价格倍数，便于评估超长请求成本。

我的数据会被存储吗？

不会发送到服务器。所有计算都在浏览器本地完成，只会用 localStorage 在本设备保存上次输入。

LLM API 成本计算器 - CalculatorBox

模型	每日成本	每月成本	相对最低价可省
Gemini 2.5 Flash-Lite	$0.44	$13.2	0.0%
Llama 4 Maverick	$0.88	$26.4	50.0%
DeepSeek V3	$1.2	$36	63.3%
Gemini 3.5 Flash	$1.33	$39.9	66.9%
GPT-5 mini	$1.7	$51	74.1%
Claude Haiku 4.5	$4	$120	89.0%
Qwen Max	$7.04	$211.2	93.8%
GPT-5	$8.5	$255	94.8%
Gemini 3.1 Pro	$14	$420	96.9%
Claude Sonnet 4.6	$15	$450	97.1%
Claude Opus 4.7	$75	$2,250	99.4%

如何使用 LLM API 成本计算器

LLM API 成本计算器用于在产品上线前估算大模型功能的真实运行成本。你只需要输入日均 API 调用次数、平均输入 token 数和平均输出 token 数，右侧表格就会实时对比 Gemini 3.5 Flash、Gemini 3.1 Pro、Gemini 2.5 Flash-Lite、Claude Opus 4.7、Claude Sonnet 4.6、Claude Haiku 4.5、GPT-5、GPT-5 mini、DeepSeek V3 等主流模型的每日成本与每月成本。

如果还没有精确数据，可以先点击场景预设。客服机器人通常调用量高但单次 token 较少，代码补全请求频繁且输出较短，RAG 应用会把检索片段放进输入中，Agent 工作流会携带工具调用历史，长文档总结则常常拥有很大的输入上下文。选择预设后，再根据自己的业务指标微调即可。

涉及金额的所有结果都受货币下拉框控制，表格、摘要卡片和建议区都会显示对应货币符号。Batch API 开关会对适合异步处理的任务应用 50% 折扣。Context Caching 开关会显示缓存命中率滑块，当系统提示词、工具 schema 或稳定 RAG 上下文能够复用时，可以快速观察缓存带来的成本变化。

公式与原理 - LLM API 成本计算器

LLM API 成本计算器采用各模型静态 JSON 定价数据，价格单位为每百万 token。核心公式如下：

单次请求成本 =
  (输入 token / 1,000,000) × 输入单价
  + (输出 token / 1,000,000) × 输出单价

月成本 =
  单次请求成本 × 日均调用次数 × 30

当开启 Batch API 折扣时：

Batch 后成本 = 正常成本 × 0.5

当开启 Context Caching 时，缓存命中的输入 token 按正常输入价格的 10% 计算：

有效输入 token =
  未缓存输入 token + 已缓存输入 token × 0.1

Gemini 3.1 Pro 还包含长上下文阶梯定价逻辑。当平均输入 token 超过 200,000 时，该模型会应用价格倍数。这一点很重要，因为短请求下看起来便宜的模型，在超长上下文场景中可能会变成另一种成本结构。

表格中的“相对最低价可省”用于衡量每个模型相对最便宜模型的节省空间。例如某模型月成本为 100 美元，而当前最便宜模型为 60 美元，则切换后可节省该模型成本的 40%。这比单纯看价格更直观，也适合快速判断升级到更强模型的成本代价。

使用场景 - LLM API 成本计算器

LLM API 成本计算器适合产品规划、供应商对比、模型迁移和预算复盘。产品经理可以用它判断新 AI 功能是否符合预算，工程师可以在 Gemini API pricing calculator、gemini vs claude pricing、cheapest llm api 2026 等对比场景中快速评估不同模型，财务或运营团队也可以把 token 预测转成可理解的每日和每月费用。

在客服机器人中，它能展示高调用量对成本的影响；在 RAG 应用中，它能揭示检索上下文长度的成本压力；在 Agent 工作流中，它能估算工具调用历史和多轮推理的累积费用；在长文档总结中，它能提醒团队：大上下文窗口非常强大，但并不一定天然便宜。

这个计算器完全前端运行，不调用任何后端 API。模型价格以内联静态数据呈现，输入历史只保存在浏览器本地，因此适合快速试算、分享思路和做内部预算讨论。

LLM API 成本计算器