开个帖子聊聊小米MIMO新的定价逻辑背后的原因

	API价格 ¥/M	x100	Credit/Token
V2.5命中缓存	0.020	2	2
V2.5未命中	1	100	100
V2.5输出	2	200	200
Pro命中缓存	0.025	2.5	2.5
Pro未命中	3	300	300
Pro输出	6	600	600

档位	Plan 价	等价 API 用量	便宜
Lite	¥39	¥41	~5%
Standard	¥99	¥110	~10%
Pro	¥329	¥380	~13%
Max	¥659	¥820	~20%

shengdr

2026-05-27 #4

新套餐的定价逻辑一目了然

12

4

都是做图小能手啊

这图一目了然

5个回复 ⌃

cmd

2026-05-27

佬这个提示词是什么呢，感觉很适合做总结类的说明图片

hulikk

2026-05-27

总结的很到位，看明白了，区分就是调整KV在缓存这块更强了。

linwan623910

2026-05-27

这种gpt生图,用的什么提示词呢？

clark1028

2026-05-27

求佬友的提示词，最近很需要这个。谢谢～

Feng_Da

2026-05-27

蹲一个提示词感觉这种图说的很清楚了

↓ 跳到帖子

ZackWill 楼主

2026-05-27 #5

现在算是知道为啥大伙都在情绪输出了，讨论帖根本没人看

8

3

1个回复 ⌃

junerver

2026-05-27

看到好几个喷的mimo垃圾的、雷军营销的，一问用都没用过，咱就说确实比不过海外御三家，在国模里也算是第一梯队了，不知道哪来的这么大的恶意

4

3

↓ 跳到帖子

TOPIC OWNER

hexnouc

2026-05-27 #6

那这样算下来就相当于是API使用达量优惠了，用不满反而亏了，用量大确实有优惠，但是轻量使用还是直接API吧

4

1个回复 ⌃

ZackWill 楼主

2026-05-27

对的可以这么理解，用量小或者时间维度比较长直接像ds那样充余额就好

不过现在API确实很便宜了

TOPIC OWNER

↓ 跳到帖子

ZackWill 楼主 ↶ @hexnouc

2026-05-27 #7

对的可以这么理解，用量小或者时间维度比较长直接像ds那样充余额就好

不过现在API确实很便宜了

TOPIC OWNER

cmd ↶ @shengdr

2026-05-27 #8

佬这个提示词是什么呢，感觉很适合做总结类的说明图片

wuliaoqiecaicai

2026-05-27 #9

佬分析的很清晰，原来的plan之所以感觉消耗很快，就是因为缓存和非缓存没有做区分导致缓存命中高反而吃亏。新的计算方式就是参考ds用高缓存换低价

1

1个回复 ⌃

ZackWill 楼主

2026-05-27

是这样的，所以看上去一个你好消耗几百万都是打在无缓存上了，实际上按照百分比看可能更直观

TOPIC OWNER

↓ 跳到帖子

ZackWill 楼主 ↶ @wuliaoqiecaicai

2026-05-27 #10

是这样的，所以看上去一个你好消耗几百万都是打在无缓存上了，实际上按照百分比看可能更直观

TOPIC OWNER

aaaaccc

2026-05-27 #11

现在 token 区分缓存命中了，确实耐用很多

ZackWill 楼主

2026-05-27 #12

插播一条我自己的 token plan，30 号过期
dHAtYzdqY3hnY3p2bXFzbjBhZHB2c2lnbDF0ZTd1NXAzbWxya2I5b2xmY2c2bjgxZWo2
base64加密

2

1个回复 ⌃

junerver

2026-05-27

现在订阅重置了，完全可以1分钱续订，然后直接刷新订阅到下个月，一旦用了就不是1分续订了

1

我在上次重置的时候用过这招了

↓ 跳到帖子

TOPIC OWNER

zzzdajb

2026-05-27 #13

我不觉得小米说的那个几百亿有太离谱的问题，agent场景确实就是能用那么多，你总不能故意不命中缓存吧？

1个回复 ⌃

ZackWill 楼主

2026-05-27

目前用下来agent场景缓存命中比例和官方基本上是一致的

1

TOPIC OWNER

↓ 跳到帖子

ZackWill 楼主 ↶ @zzzdajb

2026-05-27 #14

目前用下来agent场景缓存命中比例和官方基本上是一致的

1

TOPIC OWNER

emmett

2026-05-27 #15

说一句在当前论坛离经叛道的话，deepseek v4在code 场景真的不如mimo。mimo的编码能力我认为是和glm一个级别的，如果考虑glm极慢的输出速度，那mimo甚至可以压过glm。但现在论坛里的主流声音就是不能说ds坏话，尤其是拿来和mimo对比时，ds >> mimo 是政治正确。但是我相信时间和真实体验会让风评反转，因为真正的开发者是要真金白银消费和真实消耗工作时间的。当然，风评不反转也和我没什么关系，但是至少目前的国产模型范围里，我会持续选择用mimo编码。

4

2

1

5个回复 ⌃

hulikk

2026-05-27

现在国产模型，GLM，DS，MIMO都还不错的，没有一家独大，各有发展才是好事。

1

junerver

2026-05-27

是这样的，我实测的感受也差不多，至少在我的场景下 mimo-v2.5-pro是和 glm-5.1 、ds-v4-pro 有来有回的，所以我现在基本都是在用mimo，因为智能足够、输出更快

mrbbbaixue

2026-05-27

说一句离经叛道的话,dsv4f秒杀别的模型甚至GPT 5.5，在我这边用来写UE cpp就是这样的

所以这种完全是看工况的

a12908

2026-05-27

时间和真实体验会让风评反转？以现在的迭代速度下个月都不知道变啥样了哪有那么多时间转来转去下个月又一堆新模型要发出来了传闻中的多模态V4.1也在下个月

giglf

2026-05-27

mimo还没用，最近写的一个项目deepseek-v4-pro用起来给我感觉跟GLM-5.1差不多，比不上gpt5.5。不过ds确实便宜，但是ds没有多模态也没有图像模型，我还得给agent接个glm的图像理解模型来用

↓ 跳到帖子

hulikk ↶ @shengdr

2026-05-27 #16

总结的很到位，看明白了，区分就是调整KV在缓存这块更强了。

hulikk ↶ @emmett

2026-05-27 #17

现在国产模型，GLM，DS，MIMO都还不错的，没有一家独大，各有发展才是好事。

1

junerver ↶ @ZackWill

2026-05-27 #18

看到好几个喷的mimo垃圾的、雷军营销的，一问用都没用过，咱就说确实比不过海外御三家，在国模里也算是第一梯队了，不知道哪来的这么大的恶意

4

3

junerver ↶ @ZackWill

2026-05-27 #19

现在订阅重置了，完全可以1分钱续订，然后直接刷新订阅到下个月，一旦用了就不是1分续订了

1

我在上次重置的时候用过这招了

junerver ↶ @emmett

2026-05-27 #20

是这样的，我实测的感受也差不多，至少在我的场景下 mimo-v2.5-pro是和 glm-5.1 、ds-v4-pro 有来有回的，所以我现在基本都是在用mimo，因为智能足够、输出更快

ddd

2026-05-27 #21

挺好的事，大家都有便宜token用，为什么小米就不行呢，我不理解

1个回复 ⌃

ALiang0918

2026-05-27

已经有人在说这个计费规则小字营销了，刚刚都看到有人提一元硬币的事了，风评是真差

↓ 跳到帖子

ALiang0918 ↶ @ddd

2026-05-27 #22

已经有人在说这个计费规则小字营销了，刚刚都看到有人提一元硬币的事了，风评是真差

ZackWill 楼主

2026-05-27 #23

我是真没招了，甚至引用的这个帖子里的plan优惠计算

1个回复 ⌃

cyfer

2026-05-27

行那我换一篇引用。

你自己都算出订阅只有 20% 优惠了，怎么好意思帮小米护航的？

↓ 跳到帖子

TOPIC OWNER

wenliang_zeng

2026-05-27 #24

DS不永久降价她也不降这不是被老东家背刺了吗

1个回复 ⌃

ZackWill 楼主

2026-05-27

为什么要把ds降价和小米降价这两件事情强行绑定在一起呢？降价的原因我帖子里也贴出来了，刚起步的团队优化基建带来了更低的价格，怎么你ds就是在亏本贴钱卖token？我看也不是吧。国模降价是好事，大家都是很优秀的模型和团队，何必拉踩

1

TOPIC OWNER

↓ 跳到帖子

ZackWill 楼主 ↶ @wenliang_zeng

2026-05-27 #25

为什么要把ds降价和小米降价这两件事情强行绑定在一起呢？降价的原因我帖子里也贴出来了，刚起步的团队优化基建带来了更低的价格，怎么你ds就是在亏本贴钱卖token？我看也不是吧。国模降价是好事，大家都是很优秀的模型和团队，何必拉踩

1

1个回复 ⌃

wenliang_zeng

2026-05-27

那可以分析一下为什么小米一开始定价那么贵吗？小米和国模降价扯不到一起去，今天二十分钟写文档用了12亿，那么想问一下这个和给你100万然后告诉你我的豆浆涨价到10万一杯你爱买不买的区别在哪

↓ 跳到帖子

TOPIC OWNER

cyfer ↶ @ZackWill

2026-05-27 #26

行那我换一篇引用。

你自己都算出订阅只有 20% 优惠了，怎么好意思帮小米护航的？

1个回复 ⌃

ZackWill 楼主

2026-05-27

所以我在请教你别家plan能优惠到什么比例啊？另外客观陈述事实为什么就变成了帮小米护航？

TOPIC OWNER

↓ 跳到帖子

rparris1120

2026-05-27 #27

一直没有用过小米的模型，不知道在国内算是什么名次？有用过的佬，多分享下！

wenliang_zeng ↶ @ZackWill

2026-05-27 #28

那可以分析一下为什么小米一开始定价那么贵吗？小米和国模降价扯不到一起去，今天二十分钟写文档用了12亿，那么想问一下这个和给你100万然后告诉你我的豆浆涨价到10万一杯你爱买不买的区别在哪

1个回复 ⌃

ZackWill 楼主

2026-05-27

原因就在这里，用量别光看大数字，看比例，你非要觉得credit就是token那我也拦不住你

TOPIC OWNER

↓ 跳到帖子

ZackWill 楼主 ↶ @wenliang_zeng

2026-05-27 #29

原因就在这里，用量别光看大数字，看比例，你非要觉得credit就是token那我也拦不住你

1个回复 ⌃

wenliang_zeng

2026-05-27

credit的折算token只是为了收割而不是为了方便计算而且他们的工具拉胯到不行建议自己亲自去长时间使用

↓ 跳到帖子

TOPIC OWNER

ZackWill 楼主 ↶ @cyfer

2026-05-27 #30

所以我在请教你别家plan能优惠到什么比例啊？另外客观陈述事实为什么就变成了帮小米护航？

1个回复 ⌃

cyfer

2026-05-27

小米 39 元的订阅套餐只给等值 41 元的额度你都能帮他说话，这不是护航是什么？

别家能用多少不是告诉你了吗？怎么不说话了？

1

↓ 跳到帖子

TOPIC OWNER

wenliang_zeng ↶ @ZackWill

2026-05-27 #31

credit的折算token只是为了收割而不是为了方便计算而且他们的工具拉胯到不行建议自己亲自去长时间使用

1个回复 ⌃

ZackWill 楼主

2026-05-27

这一句能展开讲讲吗？折算和收割这两个词的内在关系是啥？我日常所有的运维工作都是mimo来做的，从v2时代用到现在

TOPIC OWNER

↓ 跳到帖子

ZackWill 楼主 ↶ @wenliang_zeng

2026-05-27 #32

这一句能展开讲讲吗？折算和收割这两个词的内在关系是啥？我日常所有的运维工作都是mimo来做的，从v2时代用到现在

1个回复 ⌃

wenliang_zeng

2026-05-27

没改价之前的credit和token我计算的大概是10:1，然后在cc里面各种死循环调用，任何一家模型都没有出现过问题，官方反馈是我们使用的提示词不对导致mimo死循环调用。测算了一下39的套餐在低强度使用的情况下可能半个小时都不到就用完了还要忍受他的工具非常难用的问题如果说为了方便计算，那么我起码要可以看到价格透明度，我没有说一开始定价那么高有什么问题，我只是觉得你定价高你必须告诉我你的一个计算方式到底是怎么样。以下是我的上次赠送的套餐的消耗，结果就是，什么都没有收到。至于你说的折算和收割的关系，credit定价权在他们手里，兑换比例他们内部才清楚，你自己用token你自己能算，但是用credit你怎么算

你是不是以为原本缓存不计费

↓ 跳到帖子

TOPIC OWNER

cyfer ↶ @ZackWill

2026-05-27 #33

小米 39 元的订阅套餐只给等值 41 元的额度你都能帮他说话，这不是护航是什么？

别家能用多少不是告诉你了吗？怎么不说话了？

1

wenliang_zeng ↶ @ZackWill

2026-05-27 #34

没改价之前的credit和token我计算的大概是10:1，然后在cc里面各种死循环调用，任何一家模型都没有出现过问题，官方反馈是我们使用的提示词不对导致mimo死循环调用。测算了一下39的套餐在低强度使用的情况下可能半个小时都不到就用完了还要忍受他的工具非常难用的问题如果说为了方便计算，那么我起码要可以看到价格透明度，我没有说一开始定价那么高有什么问题，我只是觉得你定价高你必须告诉我你的一个计算方式到底是怎么样。以下是我的上次赠送的套餐的消耗，结果就是，什么都没有收到。至于你说的折算和收割的关系，credit定价权在他们手里，兑换比例他们内部才清楚，你自己用token你自己能算，但是用credit你怎么算

你是不是以为原本缓存不计费

2个回复 ⌃

ZackWill 楼主

2026-05-27

credit/token换算关系官方的帖子里说的很清楚，我不认为这其中有任何隐瞒定价的问题，反倒是token plan才是定价最清晰的一种。很多订阅制只给你一个模糊的调用次数或者用量百分比，那才是真黑盒。

TOPIC OWNER

junerver

2026-05-27

之前是 1:1 和 1:2 ，咋能出1:10呢

其实也不用吵，不好用不用就完事了呗，哪个好用用哪个，这玩意也没有说绑定了必须用。另外米子没有出工具吧，你说的非常难用的工具是啥啊？复读死循环很多模型都有，但却是出现了是很烦。

↓ 跳到帖子

ZackWill 楼主 ↶ @wenliang_zeng

2026-05-27 #35

credit/token换算关系官方的帖子里说的很清楚，我不认为这其中有任何隐瞒定价的问题，反倒是token plan才是定价最清晰的一种。很多订阅制只给你一个模糊的调用次数或者用量百分比，那才是真黑盒。

1个回复 ⌃

wenliang_zeng

2026-05-27

我知道哇，我没有说他改价后不清晰吧，那改价前不是为了收割？然后官方下场抬价，至于你说的token plan，我每天可以根据自己的输入输出返回token，缓存也是，ccs也是有这个功能，早就黑盒透明化了。

↓ 跳到帖子

TOPIC OWNER

wenliang_zeng ↶ @ZackWill

2026-05-27 #36

我知道哇，我没有说他改价后不清晰吧，那改价前不是为了收割？然后官方下场抬价，至于你说的token plan，我每天可以根据自己的输入输出返回token，缓存也是，ccs也是有这个功能，早就黑盒透明化了。

junerver ↶ @wenliang_zeng

2026-05-27 #37

之前是 1:1 和 1:2 ，咋能出1:10呢

其实也不用吵，不好用不用就完事了呗，哪个好用用哪个，这玩意也没有说绑定了必须用。另外米子没有出工具吧，你说的非常难用的工具是啥啊？复读死循环很多模型都有，但却是出现了是很烦。

1个回复 ⌃

wenliang_zeng

2026-05-27

言尽于此，1:10是通过数据测算的，至于工具是模型本身对工具的使用，可能很多都有这种问题，但是我在mimo上出现的比较多罢了，也可能是我的用法不对

↓ 跳到帖子

linwan623910 ↶ @shengdr

2026-05-27 #38

这种gpt生图,用的什么提示词呢？

mrbbbaixue ↶ @emmett

2026-05-27 #39

说一句离经叛道的话,dsv4f秒杀别的模型甚至GPT 5.5，在我这边用来写UE cpp就是这样的

所以这种完全是看工况的

EntID

2026-05-27 #40

很好的技术分析贴，比起同话题帖子的技术含量与客观分析含量显然更高，给佬友点赞

1

clark1028 ↶ @shengdr

2026-05-27 #41

求佬友的提示词，最近很需要这个。谢谢～

wenliang_zeng ↶ @junerver

2026-05-27 #42

言尽于此，1:10是通过数据测算的，至于工具是模型本身对工具的使用，可能很多都有这种问题，但是我在mimo上出现的比较多罢了，也可能是我的用法不对

1个回复 ⌃

junerver

2026-05-27

┑(￣Д ￣)┍，主要我一直接在axonhub里，token用量上 CCHV 与 axonhub 和mimo后台都是能对上的，你说1:10有点离谱的，你的表达意味着mimo在偷偷加倍率。

还有你说的米子工具不好用，我没明白你说的是啥，因为米子没有自己的agent产品啊。

至于你说的复读，不巧我刚刚在 GLM-5.1 遇到了，这个确实该喷，复读然后还扣费确实恶心人，国产模型复读现在还是会有的：

↓ 跳到帖子

qinshou

2026-05-27 #43

一直没理解，这个缓存跟没缓存，是啥意思？没注意过这个，感觉有缓存的，是不是消耗了就比没缓存的要少很多

1个回复 ⌃

ZackWill 楼主

2026-05-27

缓存指的是大模型推理过程中产生的中间态数据kv cache，这个数据是可以在每次推理之间复用的，可以极大缓解计算的压力。所以各家有缓存的价格通常来说会被无缓存定价低很多。

TOPIC OWNER

↓ 跳到帖子

junerver ↶ @wenliang_zeng

2026-05-27 #44

┑(￣Д ￣)┍，主要我一直接在axonhub里，token用量上 CCHV 与 axonhub 和mimo后台都是能对上的，你说1:10有点离谱的，你的表达意味着mimo在偷偷加倍率。

还有你说的米子工具不好用，我没明白你说的是啥，因为米子没有自己的agent产品啊。

至于你说的复读，不巧我刚刚在 GLM-5.1 遇到了，这个确实该喷，复读然后还扣费确实恶心人，国产模型复读现在还是会有的：

1个回复 ⌃

wenliang_zeng

2026-05-27

复读扣费然后客服说是你们自己用法问题，谁能绷住

↓ 跳到帖子

a12908 ↶ @emmett

2026-05-27 #45

时间和真实体验会让风评反转？以现在的迭代速度下个月都不知道变啥样了哪有那么多时间转来转去下个月又一堆新模型要发出来了传闻中的多模态V4.1也在下个月

ZackWill 楼主 ↶ @qinshou

2026-05-27 #46

缓存指的是大模型推理过程中产生的中间态数据kv cache，这个数据是可以在每次推理之间复用的，可以极大缓解计算的压力。所以各家有缓存的价格通常来说会被无缓存定价低很多。

1个回复 ⌃

qinshou

2026-05-27

简单说就是上下文当中有相同的对话可以直接重复使用，而并不会重新生产，这样的确节省了，原来如此，佬，那像这种命中率是一般大模型自己本身自主。筛选的，还是本身就设定好了萌新发言，问题太蠢了，望大佬见谅

↓ 跳到帖子

TOPIC OWNER

qinshou ↶ @ZackWill

2026-05-27 #47

简单说就是上下文当中有相同的对话可以直接重复使用，而并不会重新生产，这样的确节省了，原来如此，佬，那像这种命中率是一般大模型自己本身自主。筛选的，还是本身就设定好了萌新发言，问题太蠢了，望大佬见谅

1个回复 ⌃

ZackWill 楼主

2026-05-27

命中率根据实际使用情况来看的，并且和时间也有关系，推理过程中kv cache的量级可以到成百上千GB，所以这种缓存也不会一直存在，一般会设定一个时间阈值来把缓存换出到本地内存甚至SSD，最后完全丢掉。命中率只是这套体系运转之后的最终体现，并不是一个可以直接指定的值

TOPIC OWNER

↓ 跳到帖子

Feng_Da ↶ @shengdr

2026-05-27 #48

蹲一个提示词感觉这种图说的很清楚了

ZackWill 楼主 ↶ @qinshou

2026-05-27 #49

命中率根据实际使用情况来看的，并且和时间也有关系，推理过程中kv cache的量级可以到成百上千GB，所以这种缓存也不会一直存在，一般会设定一个时间阈值来把缓存换出到本地内存甚至SSD，最后完全丢掉。命中率只是这套体系运转之后的最终体现，并不是一个可以直接指定的值

1个回复 ⌃

qinshou

2026-05-27

收到，不过我这猪脑子，估计还得理解理解，就普通的理解，像小米的这个模型，正常用于一些龙虾，爱马仕，这些正常聊天应该是够的，因为平常用的是5.5和deepseekv4pro 这要不要更换

↓ 跳到帖子

TOPIC OWNER

qinshou ↶ @ZackWill

2026-05-27 #50

收到，不过我这猪脑子，估计还得理解理解，就普通的理解，像小米的这个模型，正常用于一些龙虾，爱马仕，这些正常聊天应该是够的，因为平常用的是5.5和deepseekv4pro 这要不要更换

wenliang_zeng ↶ @junerver

2026-05-27 #51

复读扣费然后客服说是你们自己用法问题，谁能绷住

giglf ↶ @emmett

2026-05-27 #52

mimo还没用，最近写的一个项目deepseek-v4-pro用起来给我感觉跟GLM-5.1差不多，比不上gpt5.5。不过ds确实便宜，但是ds没有多模态也没有图像模型，我还得给agent接个glm的图像理解模型来用

1个回复 ⌃

ZackWill 楼主

2026-05-27

可以试试看mimo-v2.5，原生多模态的模型

TOPIC OWNER

↓ 跳到帖子

ZackWill 楼主 ↶ @giglf

2026-05-27 #53

可以试试看mimo-v2.5，原生多模态的模型

TOPIC OWNER

开个帖子聊聊小米MIMO新的定价逻辑背后的原因

定价逻辑锚点：1亿credit = 1¥

为什么说比旧套餐“用量提升5-8倍”？

为什么非得用这个 Credit 来定价不直接用 token？

降价背后的隐藏逻辑