不是为资本说话. 但是GLM5.1全量部署一个至少要几十万成本吧

纯水人工智能
查看原帖

在模态框中查看主贴与评论的删除、修改和新增情况。

b9348
b9348 楼主
#1

rt, 首先声明我不懂行, 都是在站内看到的

根据我看到的信息, 我认为几十万成本估计全天不间断蹬估计也就够十几个人最高档套餐同时用, 哪怕是原价最贵一个人也只是469, 10个4690,20个都不到一万, 回本都要几十个月了

说白了几十万的设备一个月顶天估计也就能挣一两万还不是纯利
估计智谱都投产借贷几千万了, 如果不是真的成本高, 谁又愿意开公司落得一身骂名


补一段

20块一个月的时代已经彻底结束了, 全球都不再有这种价格了, 除了新用户
现在已经不是glm4.5 128k 20块一个月 大家只用roo起步只吃7-8k的时代 过了一半窗口就开新对话因为难用得要命的时代了
一大堆skill mcp cc起步就是两位数k的上下文占用, 更何况多少人因为200k时长把窗口用到100k以上
这种高额的推理成本不可同日而语

4.7时代不论是参数量还是窗口都是现在一半的水平, 那时候低价还可以说是拉新, 现在市场已经承认了ai编程, token几乎不可能再回到之前的定价了, 各位要接受这个现实, 在站里再怎么和黑骂也是没用的

:heart:5:distorted_face:3:laughing:2
cloud123666
moxiyan然后斥巨资买楼是吧
pyo123213000亿市值,你说啥呢
kobolingl站的发言规则保护了你
huanchong是他先骗后杀呀
yiwanyang智谱给了多少
Xuezi003原来是我狭隘了,z大善人:sob:
zhang.aladdin嘤嘤嘤不是为了资本说话
Jevanzhu看得出来你是真不懂。转身买了栋楼
TOPIC OWNER
65楼层
64回复
58用户
b9348 linhaixin Zeus1 jv-kssma luoxiaoxin llllllll

评论第 1 页,共 2 页

linhaixin
linhaixin
#2

互联网时代大都是靠量取胜,花几十万部署在本地的大模型应该不是为了盈利的,而是为了数据安全 :joy:

:heart:11
Zeus1
Zeus1
#3

他们不这么搞怎么融资怎么赚更多的钱?为什么能说出

我完全看不懂

:heart:8
Miantia0看不懂+1
wanxingge同样+1
jv-kssma
jv-kssma
#4

目前雲api的確大多賺不了錢, 除非是本身大量採購能壓低採購價的

這也是為什麼我買完5090玩了幾個月後就變成純打遊戲了 (Bushi 媳婦兒, 我當初買真的是想玩AI的)

要用AI還是用雲API

另外自家部署的另一個原因是數據安全, 有些機構沒得選

:heart:2
luoxiaoxin
luoxiaoxin
#5

你以为人家赚的是用户的米?
人家其实是为了拉投资,上市爆投资人的米
然后再狠狠提价赚用户的米,出一张好看的财报,再去爆投资人的米。周而复始

:heart:12:laughing:6:+1:2:tieba_087:1
llllllll
llllllll
#6

8卡H20 一台150w左右, 还不够,至少十几台才能够给他人用的级别

1个回复
yorksu
yorksu

确实是,FP8部署的话,剩余可以给kv cache的显存太小了,并发度很低。实测给 claude code 用户提供的话,基本上并发只能到5左右,基本上没法用。

↓ 跳到帖子
fish2018
fish2018
#7

你是在代入智普的身份来回应背刺老用户的问题吗?
花钱买套餐的老用户怎么可能不懂部署成本呢,他们感到背刺了,抒发一下不满,找点共情,这时候你跳到对立面讲道理,显然不太合时宜 :distorted_face:

:heart:9:+1:5
626讲得好
Bliod
#8

(帖子已被作者删除)

po_k
po_k
#9

智谱有钱买楼,没钱部署大模型,你还替智:divide:说话

:heart:8:+1:1:laughing:1
1个回复
llllllll
llllllll

应该是买不到卡了。但超卖就是死罪了,没得洗

:+1:1
↓ 跳到帖子
chairo
chairo
#10

收集到的数据能卖多少钱你倒是也算算啊。。

:laughing:2
yorksu
#11

确实是,FP8部署的话,剩余可以给kv cache的显存太小了,并发度很低。实测给 claude code 用户提供的话,基本上并发只能到5左右,基本上没法用。

fengjicheng
fengjicheng
#12

(帖子已被作者删除)

silenceteaaaaa
silenceteaaaaa
#13

不能这么算,我买设备还有资产呢,买服务他跑路了就啥都没了

Bin29
Bin29
#14

无论什么时代,什么情况下,消费者都不需要为老板买单

wind1542
#15

别开玩笑了,这些公司部署模型只是为了靠卖plan赚钱吗,获得的数据是一分没说啊,公司业务只有toC的plan业务吗

:heart:3
GPLer
#16

B200 x8 部署 FP8,全速并发最起码有几百吧,如果 20token/s 左右几千应该也扛得住,而且目前都超售,也不是同时使用,1台机器服务1万个人应该差不多。
再说了,老黄每一代性能都是基本上翻倍增长,买的越多赚的越多,就别给资本洗地了。

mxdlzg
#17

公司更重要的是,能融资,能抬升估值,这里面能做的故事就太多了

llllllll
llllllll ↶ @po_k
#18

应该是买不到卡了。但超卖就是死罪了,没得洗

:+1:1
panhaohao
panhaohao
#19

不管他成本怎么样,我花了我的钱就应该享受到对应的服务,而不是天天被被刺

:heart:2:+1:1
Bamboo_OvO
Bamboo_OvO
#20

一开始也没人逼他们定这个价吧,自己定价了后面又改服务条款,被骂不是很正常?

很简单的道理,谁便宜好用买谁就行了,如果你是为国产而买单,那就不要抱怨。

:heart:3
user1804
user1804
#21

openai大善人,天天白嫖呢,我宁愿多花钱买GPT也不会买GLM

chixigua_xu
chixigua_xu
#22

你的观点就是在为他说话准确点来说的话,要不是竞争力足够强大,他能把条款改得更加的肆意妄为。要不是现在国外模型给的压力太大,国内模型给的压力一些也不逊色,要不然就你就会知道他的一个嘴脸了。资本家永远把你们当成韭菜,你同情资本家,他把你当成一颗有一颗更加听话的韭菜而已。

:heart:5:+1:2
1个回复
bill32026

与其说是同情资本家
还不如说,在这全球只有几家寡头能竞争
而行业是百年难见风口,全球又有疯狂的投资与暴涨的需求量

一般使用者,无论在国内国外
本质,就是妥妥的韭菜 或 用来背刺的一次性快消品
那是难以避免的现实了

↓ 跳到帖子
Vertin
Vertin
#23

我还是用我的chatgpt吧。

鬼知道下一次背刺又是什么时候。

bill32026
#24

同量的TOKEN消费,企业API花的钱是老订阅Plan的十倍,可能更多
现在国产模型开始能打,合规要求、AI化敍事令企业需求暴增

算力在全球都是压力,智普的压力是众所周知的
智普在搞收支平衡,在IPO,那投资人取向是很明显了

老订阅在智谱模型还不行时支持国产,在模型开始能力就被清算福利,那情绪不满是情理兼备

但是从商业逻辑看智谱的做法又是理所当然

:heart:1
moxiyan
moxiyan
#25

你标题的前半句话已经表明了你的观点,你在刻意解释,无非是想掩饰。跟我搁这儿说成本干什么,亏钱了让我承担责任,赚钱的时候分我么

:+1:4:heart:4
Z181z784是这个道理
koast18
koast18
#26

你是资方不?不是的话那站在那边说话干嘛?

它超售的时候也没降价啊,经典风雨同舟问题,下一个。

:heart:1
blick
#27

如果收入覆盖不了成本(而且按照你的说法,是远远覆盖不了),那么这个不赚钱的商业模式为什么会铺开呢,骗投资人的钱吗?智谱这下是两头堵了。

fang2hou
fang2hou
#28

成本高大家都知道,但是大家花钱买不就是因为套餐展现了极高性价比,所以才买的。那时候 GLM 4.5 和国外主流模型性能差多少,只能说懂得都懂。

显卡国内受限也不是新闻了,一直以来都是这个情况,定价又不是用户逼着定的,问题就是当时那个质量你定高了就是没有人要买。我买 GLM Max 一方面就是支持国产模型,另外就是我 Claude Max 跑完了不至于没有备胎。

新套餐按 token 算,400块每周15亿左右,价格已经齐平 OpenAI Pro 100 刀每周 25 亿了,而且 OpenAI 还时不时 Reset 一下。就算 GLM 5.1 强,但是说实话也没到 GPT 5.4 的水平,稳定性更是差了一大截。

:heart:1
#29

与其说是同情资本家
还不如说,在这全球只有几家寡头能竞争
而行业是百年难见风口,全球又有疯狂的投资与暴涨的需求量

一般使用者,无论在国内国外
本质,就是妥妥的韭菜 或 用来背刺的一次性快消品
那是难以避免的现实了

YoungGene
YoungGene
#30

他是上市公司呀,在这种AI革命的时代,谁家不是烧钱抢用户?他既然上市了,更应该扩大用户量换投资换股价,然后买算力买电推新模型,这样才能玩的下去。虽然咱们国产的模型现在确实算力受限很难顶,但是背刺用户真的不好,应该有更好的方案的。

1个回复
bill32026

那要用code plan的开发者是他们目标用户
而不是有大把排着队的合规企业需求等着签约,你说的才是现实

但是看A社,看国产各平台的订价与订阅转向
那很大可能就是,企业用户的需求增长,以及算力限制的压力,AI平台的评估就是割舍开发者的体验,甚至冒被评击的损失,仍是十分合算的商业取舍

而且现在的硬体、电力也不是说有钱,就可以随便拿到的情况

↓ 跳到帖子
qaz741wsd856
qaz741wsd856
#31

大伙儿关注的焦点又不是GLM卖的贵,是扩张期一过,用户体验变得极差,且毫无诚信背刺老用户。
我想这种行为恐怕不能仅仅用硬件成本搪塞吧。

:heart:1
chrn
chrn
#32

你说得对,但是我要说:你不干有的是人干 :lark_001:

wty
wty
#33

如果专门为了卖这个,去买硬件这个逻辑是成立的。

但是作为数据中心来说,建设成本是建设成本,营收是营收。

难理解的话,你要是把他当房东看就明白了,就你这点租金,我租你多久才能回本!?

pyo12321
pyo12321
#34

公司账面不挣钱,不等于不发工资,不等于老板不挣钱。

3000亿市值的公司,老板和高层股票都挣麻了。

:heart:3
xiaoxiaoshitou
xiaoxiaoshitou
#35

但是卖服务的就是这样的, 初期成本高, 后期才有收益, 再说 coding plan 这种套餐是为了填补 卖API TOKEN 的闲时, 所以别想着他是专门为了你去做的.

Morcos
Morcos
#36

什么逻辑,无非就是拿着第一批信任用户订阅的钱反手砸到自己的模型成本里,然后不缺钱了将第一批信任用户踢出去。说实话,之前哪显着你智谱了?

:heart:1
bill32026 ↶ @YoungGene
#37

那要用code plan的开发者是他们目标用户
而不是有大把排着队的合规企业需求等着签约,你说的才是现实

但是看A社,看国产各平台的订价与订阅转向
那很大可能就是,企业用户的需求增长,以及算力限制的压力,AI平台的评估就是割舍开发者的体验,甚至冒被评击的损失,仍是十分合算的商业取舍

而且现在的硬体、电力也不是说有钱,就可以随便拿到的情况

1个回复
bill32026

开始觉得我的留言像洗地了
不过我想表达的是,有情绪很合理

但是客观现实是,想有便宜量饱的Token的开发者用户,对企业来说确实是比较能犠牲掉的一群

↓ 跳到帖子
SB_Fantast
SB_Fantast
#38

作为消费者,其实没有义务去研究厂商的部署成本或商业模式,这些是企业自身需要解决的问题。
既然智谱AI选择对外开放付费服务,那本质上就是一项标准的商业行为。

在这种前提下,用户付费购买服务,就等于双方已经形成了契约关系:
企业提供可用、稳定的服务,用户支付相应费用。

如果服务无法正常使用,问题就不应该被复杂化,更不应该转嫁到“成本高”“行业困难”等理由上。
对消费者来说,核心只有一点——要么正常提供服务,要么按约退款

这是最基本的商业规则,也是维持信任的底线。

:heart:1
cifang12
#39

第一不是每个人每个点都在用 这样设备就有空闲时间 但是空闲设备也是有折旧成本的 只要单token收益能超过消耗的电费 那就是赚的

NAZA
NAZA
#40

并不是
资本的手段 我们普通人想像不到,他们根本就不靠这个挣钱,有其他的方式

:heart:1
koboling
koboling
#41

你说的对,但是你可以不做,不能做了以后骗人说全量套餐天天朝令夕改。大家都知道ai是赔钱赚吆喝,但话又说回来你新模型出来是又需要买一批新卡吗?还是老卡可以继续用?还是说glm一两年就要倒闭了?还是说你买的卡出不了二手?

硬件设备的一次性成本也要均摊给用户吗?

那就太糟糕了

Kelan2009
Kelan2009
#42

Deepseek当时降价,花了好大功夫解释自己确实真的那个价格是赚钱的,打破了很多人的想象

同理,有没有可能现在其实智谱也未必怎么血亏?

yangmi没DeepSeek,这帮更狠
bill32026 ↶ @bill32026
#43

开始觉得我的留言像洗地了
不过我想表达的是,有情绪很合理

但是客观现实是,想有便宜量饱的Token的开发者用户,对企业来说确实是比较能犠牲掉的一群

RyanVan
RyanVan
#44

有多少能力干多少活嘛

用户不应该为你的投资失误买单

Cakk
Cakk
#45

这是墙倒众人推,如果不是企业唯利是图砍了套餐砍权益生怕老用户多占一点便宜,也不至于天天被骂吧

huanchong
huanchong
#46

现在的问题是他先开一个限时的允许自动续订,然后这个不是说你按个按钮就给你开了,是不管你套餐什么时间,补差价到你续费的这一天,然后花着钱。补完不到一个月,告诉你这个权益取消掉

lizijieqaq
lizijieqaq
#47

其实有点好奇,现在各家提供商真实成本的价格是多少。有没有业内人士现身说法一下呢?

Z181z784
Z181z784
#49

666,赚钱的时候不带我,到刷锅了就叫我刷
Z​:divide:不想干,大把多人想干
其他友商:不知道啊,自己给自己来两刀

:heart:1
Corozevari
Corozevari
#50

我们现在把GLM换掉,这时候有一个人跟你约定好了,但是后面改了之前的约定,不按照之前的约定来实行了,你怎么想? 讲道理,后续涨价是能接受的,但是之前的约定你直接抛弃不管,这肯定不合适的,这不就等同于是毁约吗。 都还不讨论429的问题,只是单纯的讨论套餐变来变去的问题

Kelan2009
Kelan2009
#51

其实不用解释这么多,这就是一个纯商业一个远大一个愿挨的事儿;如果GLM的模型拉胯,免费也没人用,他也是模型有实力了需求上来了,之前的模型定价不符合实际情况了,才调整之前的定价的。

智谱不是靠着垄断、欺诈或者政府强制力推广获取的市场份额,纯纯是商业竞争出来的,类似Anthropic,再怎么提价都是合理的商业行为。

但是在客户预期管理,以及商业化转型的沟通上,显然是有做的不到位的地方的。所以有人情绪激动骂两句,也可以理解,这些骂声应该也不起到什么根本性的影响。

不恰当的类比一下,和女朋友讲道理有用吗?人家在气头上的时候,你的理性判断再对,你也是错的。

:heart:1
realchoi
realchoi
#52

照你这么说,如果说之前 GLM4.5 时代的定价,厂商可以受得了,现在升级到 5.1 了受不了了,那你倒是也优化一下模型的成本啊。另外协议是随便改的吗?