【CNMO科技动静】2026年4月24日,OpenAI于凌晨忽然甩出GPT-5.5,API订价直接翻倍:输入5美元/百万token,输出30美元/百万token。12个小时后,DeepSeek发布V4系列预览版并同步开源MIT和谈,全线标配100万token上下文,V4-Flash输出价仅为0.28美元/百万token——是GPT-5.5 Pro的1.55‰。

也许这是偶尔撞车。但暗地里倒是全世界AI财产两条线路于统一时间的正面临撞。
跑分没欣喜,但技能底层打开了一条新路
从Benchmark看,V4的体现并无让行业感应炸裂。
DeepSeek团队于技能陈诉中开诚布公地认可:V4-Pro-Max小幅逾越当前领先的开源模子,高在GPT-5.2及Gemini-3.0-Pro,但仍掉队在GPT-5.4及Gemini-3.1-Pro,差距约莫于三到六个月。于海内,Kimi 2.六、GLM 5.1的总体体现也基本都于这条水准线以上。

假如只看跑分,曾经经靠着V3及R1桂林一枝的DeepSeek,好像也“泯然世人”了。
但这不是故事的全数。
于我看来,V4真实的价值不于那几行跑分数字上,而于在它重构了模子处置惩罚长上下文的底层方式。这比追平一两个百分点的评测成就要深刻患上多。
制约年夜模子上下文能力的焦点瓶颈,是Transformer架构中留意力机制(Attention)的繁杂度问题。换句话说,上下文越长,计较量呈二次方爆炸——这是所有做长文本模子的厂商早晚要撞上的墙。
于V4以前,行业重要经由过程压缩留意力的“宽度”(GQA)及“厚度”(MLA)来做文章。DeepSeek V3的焦点技能MLA,素质上就是经由过程低秩映照把每一个词压缩成更短的潜于向量。但问题于在,压缩以后100万个“速记符号”依然是100万个计较单元,模子还有是患上重新看到尾。
V4的做法是,最先动“长度”的刀——创始性地引入CSA/HCA混淆稀少留意力架构,于token维度长进行压缩,联合自研的DSA稀少留意力,让模子于处置惩罚超长文本时再也不对于所有token做全量计较,而是区别轻重:强联系关系的焦点内容切确读取,弱联系关系的配景信息年夜幅压缩,无关内容直接跳过。
这套机制的外部效果用两个数字就能说清:于百万token上下文场景下,V4-Pro的单token推理计较量只有V3.2的27%,KV缓存占用只有10%;V4-Flash更极度,别离压到了10%及7%。
简朴说,处置惩罚一样100万字的文本,V4只需要上一代1/4的算力及1/10的显存。这不是靠堆显卡堆出来的,而是从留意力机制的数学基础上做了一次减法。
是以,我认为长上下文能力正于从“加价功效”酿成下一代年夜模子的基础举措措施。 DeepSeek于这个问题上没有走修补老路,而是直接掀翻了传统的留意力范式。这类选择短时间内看不到炸裂的跑分反馈,但它正于重塑年夜模子行业最主要的成本布局。于算力仍旧紧缺、昂贵、欠缺的实际里,谁能把长上下文的成本布局打散重修,谁就能于下半场的Agent竞争中拿到真实的自动权。
“涨价潮”里的反向清场:不是由于激昂大方,而是由于成本真的被重构了
2026年3月以来,一个颇为魔幻的征象呈现了:不管海外的OpenAI、Anthropic,还有是海内的智谱、阿里、腾讯,AI产物与“降价”二字完全绝缘。模子越做越年夜,API价格水长船高,行业于一个月内形成为了惊人的默契——AI就该愈来愈贵,想体验更好的智能,就患上付更高的价格。
而DeepSeek V4 Pro的价格已经经迫近海内AI产物的下限,Flash版本比旧模子还有自制。发布后48小时,官方又甩出一枚炸弹:Pro及Flash的输入缓存掷中价格一步到位,打到原价的十分之一。此中,V4-Flash的缓存掷中输入价降至0.02元/百万token,叠加限时优惠后更是低到险些可以纰漏不计。

OpenRouter平台的及时数据显示,V4-Flash的加权平均输出价仅为0.279美元/百万token。统一期间,GPT-5.5 Pro的输出价为180美元,Claude Opus系列及Gemini 3.1 Pro均于12-25美元区间。也就是说,利用V4处置惩罚不异范围的文本使命,成本可以降低跨越99.8%。
当偕行都于往“更贵更强”的标的目的走时,DeepSeek选择了反标的目的“清场”。
这暗地里不是烧钱换市场,而是一套重新重构的底层架构,把推理成本推向了人们从未想象过的数目级。技能陈诉里的一组数字注释了这一切:百万token场景下,V4的KV Cache占用只是前代V3.2的10%。十分之一的成本,源头就于这里。
华泰证券的判定也指向统一个结论:市场轻易将V4理解为“降本压低算力需求”,但更主要的边际变化于在——长上下文成本降落后,繁杂Agent、多文档阐发、长周期使命、于线进修等场景的可用性被年夜幅晋升,推理挪用量与存储拜候频次有望迎来新一轮扩张。
这是我看到最深层的行业旌旗灯号:年夜模子的价格战,已经经从“谈天自制”进入了“Agent自制”的时代。 已往两年,降价的焦点逻辑是让用户用患上起对于话。但此刻,Agent事情流需要模子处置惩罚超长上下文、履行多步推理、挪用多种东西,token耗损量是简朴对于话的数十倍甚至上百倍。于这类场景下,哪怕输出价只差一两个数目级,象征着Agent能不克不及跑起来、跑不跑患上动、跑不跑患上起。
DeepSeek V4的订价计谋,素质上不是于及偕行打价格战。它是于为Agent时代的范围化落地,从头校准整个行业的成本基准线。
国产算力:从“备胎”到“要害变量”
V4此次发布还有有一重藏于细节里的变化:DeepSeek初次于正式技能文档中将华为昇腾NPU与英伟达GPU并列写入硬件验证清单。
这是一个比许多人意想到的更为深远的旌旗灯号。
据多位靠近DeepSeek的动静人士吐露,V4延期发布的真正缘故原由,不是甚么bug修不完,而是DeepSeek把整套体系从英伟达生态搬到了华为昇腾芯片上。这不是换一个驱动的轻量调解。DeepSeek R1昔时对于英伟达GPU的PTX底层做了极致优化,这是它“花小钱办年夜事”的焦点竞争力。但转到华为昇腾以后,基在英伟达的所有工程堆集全数作废,整套底层代码、调理逻辑、工程系统需要重写一遍。
难度于哪里?年夜模子参数到达万亿级别以后,算力压力从“纯计较”转向了“体系调理与通讯”。DeepSeek V4虽然经由过程MoE架构降低了单次推理的计较量,但对于内存带宽、芯片间互联、KV Cache治理的要求反而更高了。英伟达生态里,基在NVLink的单节点GPU间带宽可达TB/s级别,而昇腾于这些指标上有较着差距,更多依靠光模块举行跨节点扩大,会引入分外延迟及同步开消。于这类前提下把模子跑通、跑好,自己就是一项极为艰巨的体系工程。
但从另外一个角度看,这也象征着DeepSeek正于及国产算力深度绑缚。官方于订价申明中写道:“受限在高端算力,今朝Pro版办事吞吐十分有限,估计下半年昇腾950超节点批量上市后,Pro价格会年夜幅下调。”
这句话比许多技能参数更有信息量。它申明DeepSeek的低价,已经经再也不仅仅依靠在算法效率的晋升,而是最先及国产算力的供应节拍绑定。
与此同时,寒武纪、摩尔线程等国产芯片厂商于发布当天就完成为了Day 0适配。寒武纪已经基在vLLM推理框架完成为了V4-Flash及V4-Pro的适配,并将代码开源到GitHub社区。华泰证券指出,为支撑V4等模子的推理需求,估计新增AI加快卡11万至47万张,新增超节点283至1236台,国产算力芯片、超节点、互换芯片等环节有望加快放量。
这是中国AI财产初次将前沿模子的部署节拍与国产算力的范围化部署画上了等号。 于已往,国产算力更多饰演“备选方案”的脚色——其实买不到英伟达显卡的时辰才用。但到了V4这一代,这类瓜葛正于反转。DeepSeek把将来降价的条件直接指向昇腾950超节点的范围化部署,象征着国产算力再也不是“替补”,而是成了通往更低成本AI的要害路径。
固然,必需连结苏醒的是,这条路远没有走完。Pro版办事吞吐受限已经经申明,当前国产算力于高端芯片供应上仍有较着的瓶颈,V4的贸易化节拍现实上是被算力卡住了脖子。从算力可用到算力足够,还有有相称长的路要走。但这类把弱点摊于桌面上的坦诚,反而比那些年夜谈算力贮备的发布会更有说服力。
把4月24日的两场发布放于一路看,一个图景已经经很是清楚:全世界年夜模子正于走成两条大相径庭的路。
美国阵营的焦点逻辑是“摸索界限”。OpenAI包下了英伟达本年一半以上的Blackwell芯片产能,用极致堆料的方式寻求智力上限,订价计谋是“越强越贵”,方针客户是能付患上起高价的企业及高端开发者。Anthropic一样于这一起径上加快奔跑,Claude Opus 4.6于编程范畴成立了事实上的开发者首选职位地方,但其API价格对于中小团队来讲仍旧是一道不低的门坎。
中国阵营,以DeepSeek为代表,选择的是另外一条路:于算力约束下寻求极致效率,经由过程架构立异降低成本,用开源及低价把能力普惠出去,同时绑定国产算力生态,构建一套“自力在英伟达的可行性证实”。
这不是简朴的战略差异,而是全世界AI竞争格式的布局性分解。从OpenRouter平台数据来看,截至2026年4月,中国AI年夜模子已经持续多周挪用量逾越美国,显示国产模子正于快速突起。但23倍的本钱投入差距只换来了2.7%的机能领先,也从另外一个角度申明了中国AI于“效率”这条路径上的怪异上风。
我的判定是:这两条路没有绝对于的高下之分,但它们将塑造彻底差别的财产生态。 美国路径的结局多是少数巨头拥有最强模子,以高订价办事高端客户,赚取逾额利润。中国路径的结局,则多是经由过程极致效率及开源普惠,把AI酿成各行各业的基础举措措施,让年夜量中小企业及自力开发者也能用上顶级能力。
这个判定有无危害?固然有。一个必需正视的隐忧是:假如国产算力的范围化部署进度不和预期,DeepSeek的“低价普惠”叙事就可能遭受瓶颈。另外一个深层问题是,当模子能力再也不由一家公司绝对于领先,技能迭代的窗口期愈来愈短时,纯真依赖成本上风是否足以成立长期的护城河?英伟达CEO黄仁勋于本年CES上的一个判定仍旧值患上器重:开源年夜模子虽已经涉及技能前沿,但与顶尖闭源模子仍存于约6个月的代际差距。
写于末了:V4发布的意义,不于在它逾越了谁,也不于在它的跑分有多高。它真实的意义于在,于行业团体走向涨价及高算力投入的惯性轨道上,DeepSeek用一份58页的技能陈诉及一组险些刷新行业下限的价格,给出了一个“另外一种解法是彻底可行的”的证实。
版权所有,未经许可不患上转载
-必一体育
© 版权所有 2019-2025 JEE 皖ICP备12010736号-1
皖公网安备 34011102000706号