开个帖子聊聊小米MIMO新的定价逻辑背后的原因

人工智能MiMo
查看原帖
ZackWill
ZackWill 楼主
#1

定价逻辑锚点:1亿credit = 1¥

我们拉个表对比一下API的人民币定价和Credit/Token换算关系

API价格 ¥/Mx100Credit/Token
V2.5命中缓存0.02022
V2.5未命中1100100
V2.5输出2200200
Pro命中缓存0.0252.52.5
Pro未命中3300300
Pro输出6600600

规律非常明显:credit/token = API价格(¥/M) x 100,也就是1¥1亿credit。这么定的好处在于,套餐中的credit可以很轻松的换算成等值的API余额,例如lite plan定价39¥买到41亿credit,也就是白送你两块钱,各个档位优惠力度如下表,基本就是买的越大折扣越大。

档位Plan 价等价 API 用量便宜
Lite¥39¥41~5%
Standard¥99¥110~10%
Pro¥329¥380~13%
Max¥659¥820~20%

为什么说比旧套餐“用量提升5-8倍”?

首先新老套餐 Credit 的锚点不同,缓存计价逻辑也不同,不能简单的算 Credit 翻了多少倍来计算价值。为什么旧套餐包括我在内的很多人觉得消耗太快不耐用?因为当时的 Token Plan 是不区分有无缓存一视同仁的,而5-8倍用量这个值就是在引入缓存计费之后带来的提升。

以我个人的使用情况来看,最近都是运维类工作比较多,编码偏少,缓存命中率有93.5%,接近官方计算口径中的95%


为什么非得用这个 Credit 来定价不直接用 token?

一个核心的原因就是:token的价格是不定的。 V2.5 命中缓存 ¥0.02、未命中 ¥1、输出 ¥2,命中和未命中差 50 倍;Pro 是 ¥0.025 / ¥3 / ¥6,命中和未命中差 120 倍。如果直接"按 token 数"卖套餐,一个 token 该值多少钱呢?很显然这并不方便计算,所以在这层 token 之上规定了一个 Credit 来统一计费。

降价背后的隐藏逻辑

在官方宣传文章的末尾有这样一段话:

本次价格调整背后,离不开小米技术团队在推理系统上的持续优化。
我们基于 SGLang HiCache 完整支持 SWA(Sliding Window Attention),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7 ,并将可缓存 token 数量提升至优化前的近 5 倍 ,显著提升了缓存命中率和推理效率。
同时,我们通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群输入吞吐能力,从而在保障服务质量的前提下持续降低单位 token 服务成本。
后续我们将发布更加详细的推理优化技术 Blog,敬请期待。

结合之前罗福莉在访谈中对MIMO架构的介绍:

大家对MiMo第一代Flash,哪怕是Pro的感觉是——Flash能做到100-150TPS,Pro现在也能做到,看成本,基本上能做到60-100。100TPS肯定会更贵一些。所以大家用MiMo不管是Flash还是Pro的感觉是:哇好快。这就是这个结构,尤其是针对Long Context efficient的结构,带来的优势。同时,成本也够低。因为Hybrid Attention(混合注意力机制),包括在Pro这一代上,我们给它拉到一个更极致的Hybrid比例。Full Attention跟Sliding Window层的比例更极致,达到了7:1。所以它更省KV Cache。我们基本上是在这一代结构上实现了通过Sliding Window层去减少KV Cache,让它在长文上效果更能够支持更长的长上下文。同时通过MTP把Sliding Window Attention节省的算力,用MTP给它填上。这样能达到实际推理时访存跟计算的很好平衡。同时又兼顾了长上下文成本,以及推理速度。

闭环是这样的: 7:1 Hybrid 压扁 KV footprint → HiCache 多级 offload 收割小 footprint、命中缓存边际成本趋零 → 敢标 ¥0.02 命中价 → MTP 补回吞吐保证速度和单位成本。公告只讲了中间那层(HiCache),合起来才是完整的因果链。

最后,希望大家在论坛中的讨论可以理性一些,少一些主观情绪的输出, 真诚友善团结专业 ,共建你我引以为荣之社区。

:heart:34:+1:9:confetti_ball:2
TOPIC OWNER
57楼层
56回复
27用户
ZackWill shengdr hexnouc cmd wuliaoqiecaicai aaaaccc

评论第 1 页,共 2 页

shengdr
shengdr
#4


新套餐的定价逻辑一目了然:star_struck:

:heart:12:+1:4
L.y都是做图小能手啊
wuzh这图一目了然
5个回复
cmd
cmd

佬这个提示词是什么呢,感觉很适合做总结类的说明图片

hulikk
hulikk

总结的很到位,看明白了,区分就是调整KV在缓存这块更强了。

linwan623910
linwan623910

这种gpt生图,用的什么提示词呢?

clark1028
clark1028

求佬友的提示词,最近很需要这个。谢谢~

Feng_Da
Feng_Da

蹲一个提示词 感觉这种图说的很清楚了

↓ 跳到帖子
ZackWill
ZackWill 楼主
#5

现在算是知道为啥大伙都在情绪输出了,讨论帖根本没人看 :distorted_face:

:heart:8:+1:3
1个回复
junerver
junerver

看到好几个喷的mimo垃圾的、雷军营销的,一问用都没用过,咱就说确实比不过海外御三家,在国模里也算是第一梯队了,不知道哪来的这么大的恶意

:heart:4:clap:3
↓ 跳到帖子
TOPIC OWNER
hexnouc
hexnouc
#6

那这样算下来就相当于是API使用达量优惠了,用不满反而亏了,用量大确实有优惠,但是轻量使用还是直接API吧

:+1:4
1个回复
ZackWill
ZackWill 楼主

对的可以这么理解,用量小或者时间维度比较长直接像ds那样充余额就好

hexnouc不过现在API确实很便宜了
TOPIC OWNER
↓ 跳到帖子
ZackWill
ZackWill 楼主 ↶ @hexnouc
#7

对的可以这么理解,用量小或者时间维度比较长直接像ds那样充余额就好

hexnouc不过现在API确实很便宜了
TOPIC OWNER
cmd
#8

佬这个提示词是什么呢,感觉很适合做总结类的说明图片

wuliaoqiecaicai
wuliaoqiecaicai
#9

佬分析的很清晰,原来的plan之所以感觉消耗很快,就是因为缓存和非缓存没有做区分导致缓存命中高反而吃亏。新的计算方式就是参考ds用高缓存换低价

:heart:1
1个回复
ZackWill
ZackWill 楼主

是这样的,所以看上去一个你好消耗几百万都是打在无缓存上了,实际上按照百分比看可能更直观

TOPIC OWNER
↓ 跳到帖子
ZackWill
ZackWill 楼主 ↶ @wuliaoqiecaicai
#10

是这样的,所以看上去一个你好消耗几百万都是打在无缓存上了,实际上按照百分比看可能更直观

TOPIC OWNER
aaaaccc
aaaaccc
#11

现在 token 区分缓存命中了,确实耐用很多

ZackWill
ZackWill 楼主
#12

插播一条我自己的 token plan,30 号过期
dHAtYzdqY3hnY3p2bXFzbjBhZHB2c2lnbDF0ZTd1NXAzbWxya2I5b2xmY2c2bjgxZWo2
base64加密

:heart:2
1个回复
junerver
junerver

现在订阅重置了,完全可以1分钱续订,然后直接刷新订阅到下个月,一旦用了就不是1分续订了

:heart:1
ZackWill我在上次重置的时候用过这招了
↓ 跳到帖子
TOPIC OWNER
zzzdajb
zzzdajb
#13

我不觉得小米说的那个几百亿有太离谱的问题,agent场景确实就是能用那么多,你总不能故意不命中缓存吧?

1个回复
ZackWill
ZackWill 楼主

目前用下来agent场景缓存命中比例和官方基本上是一致的

:heart:1
TOPIC OWNER
↓ 跳到帖子
ZackWill
ZackWill 楼主 ↶ @zzzdajb
#14

目前用下来agent场景缓存命中比例和官方基本上是一致的

:heart:1
TOPIC OWNER
emmett
emmett
#15

说一句在当前论坛离经叛道的话,deepseek v4在code 场景真的不如mimo。mimo的编码能力我认为是和glm一个级别的,如果考虑glm极慢的输出速度,那mimo甚至可以压过glm。但现在论坛里的主流声音就是不能说ds坏话,尤其是拿来和mimo对比时,ds >> mimo 是政治正确。但是我相信时间和真实体验会让风评反转,因为真正的开发者是要真金白银消费和真实消耗工作时间的。当然,风评不反转也和我没什么关系,但是至少目前的国产模型范围里,我会持续选择用mimo编码。

:heart:4:+1:2:clap:1
5个回复
hulikk
hulikk

现在国产模型,GLM,DS,MIMO都还不错的,没有一家独大,各有发展才是好事。

:+1:1:heart:1
junerver
junerver

是这样的,我实测的感受也差不多,至少在我的场景下 mimo-v2.5-pro是和 glm-5.1 、ds-v4-pro 有来有回的,所以我现在基本都是在用mimo,因为智能足够、输出更快

mrbbbaixue
mrbbbaixue

说一句离经叛道的话,dsv4f秒杀别的模型甚至GPT 5.5,在我这边用来写UE cpp就是这样的 :laughing:

所以这种完全是看工况的

a12908
a12908

时间和真实体验会让风评反转?以现在的迭代速度下个月都不知道变啥样了 哪有那么多时间转来转去 下个月又一堆新模型要发出来了 传闻中的多模态V4.1也在下个月

giglf
giglf

mimo还没用,最近写的一个项目deepseek-v4-pro用起来给我感觉跟GLM-5.1差不多,比不上gpt5.5。不过ds确实便宜,但是ds没有多模态也没有图像模型,我还得给agent接个glm的图像理解模型来用 :distorted_face:

↓ 跳到帖子
hulikk
#16

总结的很到位,看明白了,区分就是调整KV在缓存这块更强了。

hulikk
#17

现在国产模型,GLM,DS,MIMO都还不错的,没有一家独大,各有发展才是好事。

:+1:1:heart:1
junerver
junerver ↶ @ZackWill
#18

看到好几个喷的mimo垃圾的、雷军营销的,一问用都没用过,咱就说确实比不过海外御三家,在国模里也算是第一梯队了,不知道哪来的这么大的恶意

:heart:4:clap:3
junerver
junerver ↶ @ZackWill
#19

现在订阅重置了,完全可以1分钱续订,然后直接刷新订阅到下个月,一旦用了就不是1分续订了

:heart:1
ZackWill我在上次重置的时候用过这招了
junerver
junerver ↶ @emmett
#20

是这样的,我实测的感受也差不多,至少在我的场景下 mimo-v2.5-pro是和 glm-5.1 、ds-v4-pro 有来有回的,所以我现在基本都是在用mimo,因为智能足够、输出更快

ddd
#21

挺好的事,大家都有便宜token用,为什么小米就不行呢,我不理解 :joy:

1个回复
ALiang0918
ALiang0918

已经有人在说这个计费规则小字营销了,刚刚都看到有人提一元硬币的事了,风评是真差

↓ 跳到帖子
ALiang0918
ALiang0918 ↶ @ddd
#22

已经有人在说这个计费规则小字营销了,刚刚都看到有人提一元硬币的事了,风评是真差

ZackWill
ZackWill 楼主
#23

我是真没招了,甚至引用的这个帖子里的plan优惠计算 :distorted_face:

1个回复
cyfer
cyfer

行那我换一篇引用。

你自己都算出订阅只有 20% 优惠了,怎么好意思帮小米护航的?

↓ 跳到帖子
TOPIC OWNER
wenliang_zeng
wenliang_zeng
#24

DS不永久降价她也不降 这不是被老东家背刺了吗

1个回复
ZackWill
ZackWill 楼主

为什么要把ds降价和小米降价这两件事情强行绑定在一起呢?降价的原因我帖子里也贴出来了,刚起步的团队优化基建带来了更低的价格,怎么你ds就是在亏本贴钱卖token?我看也不是吧。国模降价是好事,大家都是很优秀的模型和团队,何必拉踩

:+1:1
TOPIC OWNER
↓ 跳到帖子
ZackWill
ZackWill 楼主 ↶ @wenliang_zeng
#25

为什么要把ds降价和小米降价这两件事情强行绑定在一起呢?降价的原因我帖子里也贴出来了,刚起步的团队优化基建带来了更低的价格,怎么你ds就是在亏本贴钱卖token?我看也不是吧。国模降价是好事,大家都是很优秀的模型和团队,何必拉踩

:+1:1
1个回复
wenliang_zeng
wenliang_zeng

那可以分析一下为什么小米一开始定价那么贵吗?小米和国模降价扯不到一起去,今天二十分钟写文档用了12亿,那么想问一下这个和给你100万然后告诉你我的豆浆涨价到10万一杯你爱买不买的区别在哪

↓ 跳到帖子
TOPIC OWNER
cyfer
#26

行那我换一篇引用。

你自己都算出订阅只有 20% 优惠了,怎么好意思帮小米护航的?

1个回复
ZackWill
ZackWill 楼主

所以我在请教你别家plan能优惠到什么比例啊?另外客观陈述事实为什么就变成了帮小米护航?

TOPIC OWNER
↓ 跳到帖子
rparris1120
#27

一直没有用过小米的模型,不知道在国内算是什么名次?有用过的佬,多分享下!

wenliang_zeng
wenliang_zeng ↶ @ZackWill
#28

那可以分析一下为什么小米一开始定价那么贵吗?小米和国模降价扯不到一起去,今天二十分钟写文档用了12亿,那么想问一下这个和给你100万然后告诉你我的豆浆涨价到10万一杯你爱买不买的区别在哪

1个回复
ZackWill
ZackWill 楼主

原因就在这里,用量别光看大数字,看比例,你非要觉得credit就是token那我也拦不住你

TOPIC OWNER
↓ 跳到帖子
ZackWill
ZackWill 楼主 ↶ @wenliang_zeng
#29

原因就在这里,用量别光看大数字,看比例,你非要觉得credit就是token那我也拦不住你

1个回复
wenliang_zeng
wenliang_zeng

credit的折算token只是为了收割而不是为了方便计算 而且他们的工具拉胯到不行 建议自己亲自去长时间使用

↓ 跳到帖子
TOPIC OWNER
ZackWill
ZackWill 楼主 ↶ @cyfer
#30

所以我在请教你别家plan能优惠到什么比例啊?另外客观陈述事实为什么就变成了帮小米护航?

1个回复
cyfer
cyfer

小米 39 元的订阅套餐只给等值 41 元的额度你都能帮他说话,这不是护航是什么?

别家能用多少不是告诉你了吗?怎么不说话了?

:distorted_face:1
↓ 跳到帖子
TOPIC OWNER
wenliang_zeng
wenliang_zeng ↶ @ZackWill
#31

credit的折算token只是为了收割而不是为了方便计算 而且他们的工具拉胯到不行 建议自己亲自去长时间使用

1个回复
ZackWill
ZackWill 楼主

这一句能展开讲讲吗?折算和收割这两个词的内在关系是啥?我日常所有的运维工作都是mimo来做的,从v2时代用到现在

TOPIC OWNER
↓ 跳到帖子
ZackWill
ZackWill 楼主 ↶ @wenliang_zeng
#32

这一句能展开讲讲吗?折算和收割这两个词的内在关系是啥?我日常所有的运维工作都是mimo来做的,从v2时代用到现在

1个回复
wenliang_zeng
wenliang_zeng

没改价之前的credit和token我计算的大概是10:1,然后在cc里面各种死循环调用,任何一家模型都没有出现过问题,官方反馈是我们使用的提示词不对导致mimo死循环调用。测算了一下39的套餐在低强度使用的情况下可能半个小时都不到就用完了 还要忍受他的工具非常难用的问题 如果说为了方便计算,那么我起码要可以看到价格透明度,我没有说一开始定价那么高有什么问题,我只是觉得你定价高你必须告诉我你的一个计算方式到底是怎么样。以下是我的上次赠送的套餐的消耗,结果就是,什么都没有收到。至于你说的折算和收割的关系,credit定价权在他们手里,兑换比例他们内部才清楚,你自己用token你自己能算,但是用credit你怎么算

cyfer你是不是以为原本缓存不计费
↓ 跳到帖子
TOPIC OWNER
cyfer
#33

小米 39 元的订阅套餐只给等值 41 元的额度你都能帮他说话,这不是护航是什么?

别家能用多少不是告诉你了吗?怎么不说话了?

:distorted_face:1
wenliang_zeng
wenliang_zeng ↶ @ZackWill
#34

没改价之前的credit和token我计算的大概是10:1,然后在cc里面各种死循环调用,任何一家模型都没有出现过问题,官方反馈是我们使用的提示词不对导致mimo死循环调用。测算了一下39的套餐在低强度使用的情况下可能半个小时都不到就用完了 还要忍受他的工具非常难用的问题 如果说为了方便计算,那么我起码要可以看到价格透明度,我没有说一开始定价那么高有什么问题,我只是觉得你定价高你必须告诉我你的一个计算方式到底是怎么样。以下是我的上次赠送的套餐的消耗,结果就是,什么都没有收到。至于你说的折算和收割的关系,credit定价权在他们手里,兑换比例他们内部才清楚,你自己用token你自己能算,但是用credit你怎么算

cyfer你是不是以为原本缓存不计费
2个回复
ZackWill
ZackWill 楼主


credit/token换算关系官方的帖子里说的很清楚,我不认为这其中有任何隐瞒定价的问题,反倒是token plan才是定价最清晰的一种。很多订阅制只给你一个模糊的调用次数或者用量百分比,那才是真黑盒。

TOPIC OWNER
junerver
junerver

之前是 1:1 和 1:2 ,咋能出1:10呢 :smiling_face_with_tear:

其实也不用吵,不好用不用就完事了呗,哪个好用用哪个,这玩意也没有说绑定了必须用。另外米子没有出工具吧,你说的非常难用的工具是啥啊?复读死循环很多模型都有,但却是出现了是很烦。

↓ 跳到帖子
ZackWill
ZackWill 楼主 ↶ @wenliang_zeng
#35


credit/token换算关系官方的帖子里说的很清楚,我不认为这其中有任何隐瞒定价的问题,反倒是token plan才是定价最清晰的一种。很多订阅制只给你一个模糊的调用次数或者用量百分比,那才是真黑盒。

1个回复
wenliang_zeng
wenliang_zeng

我知道哇,我没有说他改价后不清晰吧,那改价前不是为了收割?然后官方下场抬价,至于你说的token plan,我每天可以根据自己的输入输出返回token,缓存也是,ccs也是有这个功能,早就黑盒透明化了。

↓ 跳到帖子
TOPIC OWNER
wenliang_zeng
wenliang_zeng ↶ @ZackWill
#36

我知道哇,我没有说他改价后不清晰吧,那改价前不是为了收割?然后官方下场抬价,至于你说的token plan,我每天可以根据自己的输入输出返回token,缓存也是,ccs也是有这个功能,早就黑盒透明化了。

junerver
#37

之前是 1:1 和 1:2 ,咋能出1:10呢 :smiling_face_with_tear:

其实也不用吵,不好用不用就完事了呗,哪个好用用哪个,这玩意也没有说绑定了必须用。另外米子没有出工具吧,你说的非常难用的工具是啥啊?复读死循环很多模型都有,但却是出现了是很烦。

1个回复
wenliang_zeng
wenliang_zeng

言尽于此,1:10是通过数据测算的,至于工具是模型本身对工具的使用,可能很多都有这种问题,但是我在mimo上出现的比较多罢了,也可能是我的用法不对

↓ 跳到帖子
linwan623910
linwan623910 ↶ @shengdr
#38

这种gpt生图,用的什么提示词呢?

mrbbbaixue
mrbbbaixue ↶ @emmett
#39

说一句离经叛道的话,dsv4f秒杀别的模型甚至GPT 5.5,在我这边用来写UE cpp就是这样的 :laughing:

所以这种完全是看工况的

EntID
EntID
#40

很好的技术分析贴,比起同话题帖子的技术含量与客观分析含量显然更高,给佬友点赞

:+1:1
clark1028
clark1028 ↶ @shengdr
#41

求佬友的提示词,最近很需要这个。谢谢~

wenliang_zeng
wenliang_zeng ↶ @junerver
#42

言尽于此,1:10是通过数据测算的,至于工具是模型本身对工具的使用,可能很多都有这种问题,但是我在mimo上出现的比较多罢了,也可能是我的用法不对

1个回复
junerver
junerver

┑( ̄Д  ̄)┍,主要我一直接在axonhub里,token用量上 CCHV 与 axonhub 和mimo后台都是能对上的,你说1:10有点离谱的,你的表达意味着mimo在偷偷加倍率。

还有你说的 米子工具不好用,我没明白你说的是啥,因为米子没有自己的agent产品啊。

至于你说的复读,不巧我刚刚在 GLM-5.1 遇到了,这个确实该喷,复读然后还扣费确实恶心人,国产模型复读现在还是会有的:

↓ 跳到帖子
qinshou
qinshou
#43

一直没理解,这个缓存跟没缓存,是啥意思?没注意过这个,感觉有缓存的,是不是消耗了就比没缓存的要少很多:thinking:

1个回复
ZackWill
ZackWill 楼主

缓存指的是大模型推理过程中产生的中间态数据kv cache,这个数据是可以在每次推理之间复用的,可以极大缓解计算的压力。所以各家有缓存的价格通常来说会被无缓存定价低很多。

TOPIC OWNER
↓ 跳到帖子
junerver
#44

┑( ̄Д  ̄)┍,主要我一直接在axonhub里,token用量上 CCHV 与 axonhub 和mimo后台都是能对上的,你说1:10有点离谱的,你的表达意味着mimo在偷偷加倍率。

还有你说的 米子工具不好用,我没明白你说的是啥,因为米子没有自己的agent产品啊。

至于你说的复读,不巧我刚刚在 GLM-5.1 遇到了,这个确实该喷,复读然后还扣费确实恶心人,国产模型复读现在还是会有的:

1个回复
wenliang_zeng
wenliang_zeng

复读扣费然后客服说是你们自己用法问题,谁能绷住

↓ 跳到帖子
a12908
#45

时间和真实体验会让风评反转?以现在的迭代速度下个月都不知道变啥样了 哪有那么多时间转来转去 下个月又一堆新模型要发出来了 传闻中的多模态V4.1也在下个月

ZackWill
ZackWill 楼主 ↶ @qinshou
#46

缓存指的是大模型推理过程中产生的中间态数据kv cache,这个数据是可以在每次推理之间复用的,可以极大缓解计算的压力。所以各家有缓存的价格通常来说会被无缓存定价低很多。

1个回复
qinshou
qinshou

简单说就是上下文当中有相同的对话可以直接重复使用,而并不会重新生产,这样的确节省了,原来如此,佬,那像这种命中率是一般大模型自己本身自主。筛选的,还是本身就设定好了:joy:萌新发言,问题太蠢了,望大佬见谅

↓ 跳到帖子
TOPIC OWNER
qinshou
#47

简单说就是上下文当中有相同的对话可以直接重复使用,而并不会重新生产,这样的确节省了,原来如此,佬,那像这种命中率是一般大模型自己本身自主。筛选的,还是本身就设定好了:joy:萌新发言,问题太蠢了,望大佬见谅

1个回复
ZackWill
ZackWill 楼主

命中率根据实际使用情况来看的,并且和时间也有关系,推理过程中kv cache的量级可以到成百上千GB,所以这种缓存也不会一直存在,一般会设定一个时间阈值来把缓存换出到本地内存甚至SSD,最后完全丢掉。命中率只是这套体系运转之后的最终体现,并不是一个可以直接指定的值

TOPIC OWNER
↓ 跳到帖子
Feng_Da
Feng_Da ↶ @shengdr
#48

蹲一个提示词 感觉这种图说的很清楚了

ZackWill
ZackWill 楼主 ↶ @qinshou
#49

命中率根据实际使用情况来看的,并且和时间也有关系,推理过程中kv cache的量级可以到成百上千GB,所以这种缓存也不会一直存在,一般会设定一个时间阈值来把缓存换出到本地内存甚至SSD,最后完全丢掉。命中率只是这套体系运转之后的最终体现,并不是一个可以直接指定的值

1个回复
qinshou
qinshou

收到,不过我这猪脑子,估计还得理解理解,就普通的理解,像小米的这个模型,正常用于一些龙虾,爱马仕,这些正常聊天应该是够的,因为平常用的是5.5和deepseekv4pro 这要不要更换

↓ 跳到帖子
TOPIC OWNER
qinshou
#50

收到,不过我这猪脑子,估计还得理解理解,就普通的理解,像小米的这个模型,正常用于一些龙虾,爱马仕,这些正常聊天应该是够的,因为平常用的是5.5和deepseekv4pro 这要不要更换

wenliang_zeng
wenliang_zeng ↶ @junerver
#51

复读扣费然后客服说是你们自己用法问题,谁能绷住

giglf
#52

mimo还没用,最近写的一个项目deepseek-v4-pro用起来给我感觉跟GLM-5.1差不多,比不上gpt5.5。不过ds确实便宜,但是ds没有多模态也没有图像模型,我还得给agent接个glm的图像理解模型来用 :distorted_face:

1个回复
ZackWill
ZackWill 楼主

可以试试看mimo-v2.5,原生多模态的模型

TOPIC OWNER
↓ 跳到帖子
ZackWill
ZackWill 楼主 ↶ @giglf
#53

可以试试看mimo-v2.5,原生多模态的模型

TOPIC OWNER