返回列表 发布新帖
查看: 381|回复: 6

看到小米 AI 降价的消息,这个 Plan 是不是并没有比按量 API 便宜多少?

luowu123发表于 7 天前 来自手机版 | 查看全部 |阅读模式
主要想用在文本处理优化、普通多轮问答、多模态理解,已经有 codex 了,所以不太做编程 Agent 。

我咨询了一下 GPT ,如果只是纯文字普通问答,Token Plan 似乎并没有比直接用 DeepSeek / MiMo 按量 API 省很多,大家有没有实际使用的分享一下体感?

下面是 GPT 给的一些计算逻辑:

一、官方按量 API 价格

小米 MiMo-V2.5-Pro 最新按量价:

国内:缓存命中输入 ¥0.025 / M tokens ,未命中输入 ¥3 / M ,输出 ¥6 / M

海外:缓存命中输入 $0.0036 / M ,未命中输入 $0.435 / M ,输出 $0.87 / M

小米 MiMo-V2.5 最新按量价:

国内:缓存命中输入 ¥0.02 / M ,未命中输入 ¥1 / M ,输出 ¥2 / M

海外:缓存命中输入 $0.0028 / M ,未命中输入 $0.14 / M ,输出 $0.28 / M

这个价格基本贴近 DeepSeek V4:

DeepSeek V4-Pro:$0.003625 / $0.435 / $0.87

DeepSeek V4-Flash:$0.0028 / $0.14 / $0.28

所以单看按量 API ,MiMo-V2.5-Pro ≈ DeepSeek V4-Pro ,MiMo-V2.5 ≈ DeepSeek V4-Flash 。

二、Token Plan 的 Credits 扣费规则

小米 FAQ 写的是:

MiMo-V2.5-Pro:

缓存命中输入:2.5 Credits / token

未命中输入:300 Credits / token

输出:600 Credits / token

MiMo-V2.5:

缓存命中输入:2 Credits / token

未命中输入:100 Credits / token

输出:200 Credits / token

Lite 套餐是 4.1B Credits 。官方例子也写了:用 10M MiMo-V2.5-Pro 未命中输入 token ,会消耗 3000M Credits ,还剩 1100M Credits 。

按这个比例推,人民币口径下大概可以理解为:

1B Credits ≈ ¥10 的按量 API 价值。

因为:

V2.5-Pro 输入 ¥3/M ,对应 300 Credits/token ,也就是 300M Credits ≈ ¥3

V2.5-Pro 输出 ¥6/M ,对应 600 Credits/token ,也就是 600M Credits ≈ ¥6

V2.5 输入 ¥1/M ,对应 100 Credits/token ,也就是 100M Credits ≈ ¥1

V2.5 输出 ¥2/M ,对应 200 Credits/token ,也就是 200M Credits ≈ ¥2

所以我理解是:Credits 的设计基本就是按最新按量 API 价格倒推出来的。

三、套餐实际价值粗算

按人民币口径,如果 1B Credits ≈ ¥10 API 价值:

Lite:4.1B Credits ≈ ¥41 API 价值

Standard:11B Credits ≈ ¥110 API 价值

Pro:38B Credits ≈ ¥380 API 价值

Max:82B Credits ≈ ¥820 API 价值

如果对应月费是大约:

Lite ¥39

Standard ¥99

Pro ¥329

Max ¥659

那正常月付的折扣大概是:

Lite:¥39 买约 ¥41 API 价值,约省 5%

Standard:¥99 买约 ¥110 API 价值,约省 10%

Pro:¥329 买约 ¥380 API 价值,约省 13%

Max:¥659 买约 ¥820 API 价值,约省 20%

也就是说,小套餐几乎不省钱,大套餐才有一点批发折扣。这个结论有点超过我的预期,因为“包月 Plan”听起来应该比按量 API 明显便宜很多。

四、海外社区也有人类似换算

我看到 Reddit / opencodeCLI 有人按 Lite $6 / 4.1B Credits 计算:

Lite 档下 MiMo-V2.5-Pro 大约是:

cache hit input:$0.00366 / M

cache miss input:$0.439 / M

output:$0.878 / M

这几乎贴着 DeepSeek V4-Pro:

$0.003625 / $0.435 / $0.87

Max 档 $100 / 82B Credits 才会低一些,大概变成:

V2.5-Pro cache miss input:$0.366 / M

output:$0.732 / M

也就是 Max 大概比 DeepSeek / 按量基准便宜 15% 左右。

五、我的疑问

我这个换算逻辑有没有问题?

Token Plan 是不是本质就是“预付 Credits 包”,不是传统意义上的包月订阅?

如果按量 API 已经这么便宜,Token Plan 对普通用户的意义是不是主要只有:
首购 / 年付 / 自动续费优惠

非高峰 0.8x

避免频繁充值

多模态 + TTS 免费期

对普通多轮问答用户来说,是不是 Lite / Standard 够试水,Pro / Max 只有在稳定高用量且能用完额度时才划算?
回复

使用道具 举报

酒话发表于 7 天前 来自手机版 | 查看全部
哦,还有邀请码拿 10 块钱啊,来个兄弟我马上填
回复

使用道具 举报

15515536365发表于 7 天前 来自手机版 | 查看全部
传统意义的包月订阅,跟你一个月短信 30G 流量,一样的吧。
回复

使用道具 举报

Screamidea发表于 7 天前 来自手机版 | 查看全部
还有一点要考虑 官方按量 API 价格
小米的 超过 256K 价格翻倍
DS 没这个机制
回复

使用道具 举报

myoujou发表于 7 天前 来自手机版 | 查看全部
能说说 mimo 跟 deepseek 在 cc 里哪个更便宜吗,看得我头晕
回复

使用道具 举报

熬夜也没用发表于 7 天前 | 查看全部
回答下你的疑问

如果按量 API 已经这么便宜,Token Plan 对普通用户的意义是不是主要只有:
首购 / 年付 / 自动续费优惠 :是的
非高峰 0.8x : 是一半,但 0~8 点本来也没啥需求. 批量的可以走更便宜的批量接口.
避免频繁充值 :不是,你充值也可以直接充 1000
多模态 + TTS 免费期 :不是,直接用 api ,tts 也是免费的
回复

使用道具 举报

小江学长发表于 7 天前 | 查看全部
模型        输入          输出          请求次数        缓存命中率
mimo-v2.5        434m        4.4m        120        87.48%
mimo-v2.5-pro        1610m        12.8m        186        89.19%
回复

使用道具 举报

懒得打字嘛,点击右侧快捷回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表