deepseek api按token总数计费,价格依模型类型、用量阶梯及服务层级动态变化;输入输出token均计入账单,免费额度每月100万token,阶梯定价与cu计算单元为补充维度。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您查询 DeepSeek API 的费用标准与计费逻辑,需注意其计费单位为 token(词元),且价格依模型类型、用量阶梯及服务层级动态变化。以下是具体成本构成与计算方式:
一、按 token 总数统一计费
DeepSeek API 对每次请求的输入(prompt)与输出(completion)token 一并计费,不区分阶段,所有模型均采用此规则。计费依据为响应头中 x-billed-tokens 字段所返回的实际消耗 token 数,该数值可通过官方 SDK 中 response.usage.total_tokens 获取。
1、token 切分遵循标准 Unicode 分词:中文字符通常计为 1–2 token,英文单词依子词切分,标点与空格单独计数。
2、示例计算:文本“DeepSeek API的用量模型基于Token计量”经实际分词工具处理后,token 数约为 18(非简单按字数或空格分割)。
3、若某次请求输入 320 token、输出 480 token,则本次账单计入 800 token,而非仅输出部分。
二、不同模型版本的单价差异
DeepSeek 对能力更强的模型设定更高单价,价格与参数量、上下文长度及推理延迟正相关。用户须按任务需求匹配模型,避免高配低用。
1、DeepSeek-V2(基础版):单价为 0.0005 元 / 千 token,支持 128K 上下文,适用于通用生成与摘要任务。
2、DeepSeek-Coder-V2:单价为 0.0012 元 / 千 token,内置语法感知 tokenizer,专用于代码补全与解释。
3、DeepSeek-MoE-16B(稀疏激活版):单价为 0.0028 元 / 千 token,仅对实际激活的专家路径计费,非全部 16B 参数参与运算。
三、阶梯式用量定价机制
月度累计 token 消耗量越大,对应区间的单价越低,适用于调用量随业务增长而提升的场景。该机制独立于模型单价,叠加生效。
1、以万元 token 为单位:用量在 0–100 万 token 区间,单价为 0.05 元 / 万 token;
2、用量达 100–500 万 token,单价降至 0.04 元 / 万 token;
3、用量超过 500 万 token 后,单价进一步降至 0.03 元 / 万 token。
四、免费额度与账户层级抵扣
新注册并通过企业认证的账号,自动获得每月 100 万 token 免费额度,该额度按自然月重置,未使用部分不结转,且优先用于抵扣所有模型调用费用。
1、登录 DeepSeek 控制台后,在「配额管理」页面可实时查看剩余免费额度与已消耗 token 量。
2、当月调用总 token 数为 120 万时,前 100 万 token 免费,剩余 20 万 token 按所选模型单价与阶梯区间计费。
3、免费额度对所有模型通用,不按模型类型分别分配。
五、计算资源消耗(CU)补充维度
除 token 计费外,部分高级部署方案引入计算单元(Compute Unit, CU)概念,用于衡量复杂度加权成本,公式为:CU = 输入 token 数 × 模型系数 + 输出 token 数 × 输出系数。
1、模型系数因版本而异:DeepSeek-V2 系数为 1.0,DeepSeek-Coder-V2 为 1.3,反映其更高算力需求。
2、输出系数固定为 1.5,体现生成过程的计算密集特性。
3、一次输入 500 token、输出 700 token 的 Coder-V2 请求,CU 消耗为 500×1.3 + 700×1.5 = 1700,该值可能影响资源配额或专属集群计费。











