如何使用 LLM API 成本计算器
LLM API 成本计算器用于在产品上线前估算大模型功能的真实运行成本。你只需要输入日均 API 调用次数、平均输入 token 数和平均输出 token 数,右侧表格就会实时对比 Gemini 3.5 Flash、Gemini 3.1 Pro、Gemini 2.5 Flash-Lite、Claude Opus 4.7、Claude Sonnet 4.6、Claude Haiku 4.5、GPT-5、GPT-5 mini、DeepSeek V3 等主流模型的每日成本与每月成本。
如果还没有精确数据,可以先点击场景预设。客服机器人通常调用量高但单次 token 较少,代码补全请求频繁且输出较短,RAG 应用会把检索片段放进输入中,Agent 工作流会携带工具调用历史,长文档总结则常常拥有很大的输入上下文。选择预设后,再根据自己的业务指标微调即可。
涉及金额的所有结果都受货币下拉框控制,表格、摘要卡片和建议区都会显示对应货币符号。Batch API 开关会对适合异步处理的任务应用 50% 折扣。Context Caching 开关会显示缓存命中率滑块,当系统提示词、工具 schema 或稳定 RAG 上下文能够复用时,可以快速观察缓存带来的成本变化。
公式与原理 - LLM API 成本计算器
LLM API 成本计算器采用各模型静态 JSON 定价数据,价格单位为每百万 token。核心公式如下:
单次请求成本 =
(输入 token / 1,000,000) × 输入单价
+ (输出 token / 1,000,000) × 输出单价
月成本 =
单次请求成本 × 日均调用次数 × 30
当开启 Batch API 折扣时:
Batch 后成本 = 正常成本 × 0.5
当开启 Context Caching 时,缓存命中的输入 token 按正常输入价格的 10% 计算:
有效输入 token =
未缓存输入 token + 已缓存输入 token × 0.1
Gemini 3.1 Pro 还包含长上下文阶梯定价逻辑。当平均输入 token 超过 200,000 时,该模型会应用价格倍数。这一点很重要,因为短请求下看起来便宜的模型,在超长上下文场景中可能会变成另一种成本结构。
表格中的“相对最低价可省”用于衡量每个模型相对最便宜模型的节省空间。例如某模型月成本为 100 美元,而当前最便宜模型为 60 美元,则切换后可节省该模型成本的 40%。这比单纯看价格更直观,也适合快速判断升级到更强模型的成本代价。
使用场景 - LLM API 成本计算器
LLM API 成本计算器适合产品规划、供应商对比、模型迁移和预算复盘。产品经理可以用它判断新 AI 功能是否符合预算,工程师可以在 Gemini API pricing calculator、gemini vs claude pricing、cheapest llm api 2026 等对比场景中快速评估不同模型,财务或运营团队也可以把 token 预测转成可理解的每日和每月费用。
在客服机器人中,它能展示高调用量对成本的影响;在 RAG 应用中,它能揭示检索上下文长度的成本压力;在 Agent 工作流中,它能估算工具调用历史和多轮推理的累积费用;在长文档总结中,它能提醒团队:大上下文窗口非常强大,但并不一定天然便宜。
这个计算器完全前端运行,不调用任何后端 API。模型价格以内联静态数据呈现,输入历史只保存在浏览器本地,因此适合快速试算、分享思路和做内部预算讨论。