首页 / 雷锋网 / 正文

当参数不再决定胜负,AI时代的企业级SSD靠什么「赢」?|MemoryS 2026

雷锋网 2026-04-11 01:45:16

当参数不再决定胜负,AI时代的企业级SSD靠什么「赢」?|MemoryS 2026

“全球半导体存储器的市场规模预估将突破6000亿美元。”

MemoryS 2026上,深圳市闪存市场资讯有限公司总经理邰炜抛出这一数字,彰显着存储行业的底层逻辑已悄然改变:周期性行情退场,AI主导的新范式降临。

引爆这场变革的,是AI推理对存储的指数级需求:单请求情况下,若上下文从4K Token扩展至128K Token,KV缓存会膨胀32倍,若是100个并发请求,缓存需求则达TB级。

面对这种需求量,HBM已无力承载,这就决定了KV缓存开始大规模向企业级SSD迁移。

叠加NL HDD产能缺口带来的替代效应,多重变量共振,企业级SSD正在成为2026年NAND闪存最大的应用市场。

“企业级SSD不再只是容量载体,而成了整个算力架构里突破性能瓶颈的关键。”邰炜说到。

变局之下,AI对企业级SSD的标准无限拔高,高可靠性、低时延、高寿命既是定价标尺,也是厂商厮杀的核心战场。

谁能破解“AI时代数据搬运的功耗与延迟”,谁就将定义下一个十年。

超级周期已启幕,存储厂商各有出招。

不做GPU的「配角」,SSD开始介入AI计算

当AI推理规模化爆发,存储与计算的关系正在被重新定义:SSD不再只是数据的“仓库”,而是影响Token生成效率的关键变量。

这种定位的跃迁,正在倒逼存储厂商重新思考自身的技术纵深。

以大普微为例,为了实现更快的Token生成与响应,其通过Fast SSD与TLC SSD的产品组合,打造高IOPS和低时延的数据供给能力,从而节省算力和成本。

更深一层的变化在于,存储开始介入计算的数据流调度。

大普微通过透明压缩技术实现将KV Cache的数据无损压缩21%以上,从而等效提升27%的带宽,带来直接的性能与用户容量收益。

与此同时,FDP(灵活数据放置)技术的引入,让SSD可以根据数据生命周期进行分组管理,从而降低写放大与延迟波动,为GPU提供可预期的数据供给节奏。

这些技术点的串联,勾勒出一个清晰的演进方向:SSD正在从“存储设备”进化为“AI数据调度节点”,它不仅要存得快、存得多,还要存得“聪明”,能在正确的时间把正确的数据送到正确的位置。

更值得关注的是其产品节奏与AI算力迭代的同频。

“目前,企业级SSD的市场大概能按照容量进行划分,4TB-32TB是TLC SSD的规模甜点,30TB以上则是QLC SSD的主力区间,大普微今年推出245TB的产品,明年就会设计为512TB。”大普微董事长杨亚飞对雷峰网(公众号:雷峰网)表示。

这种“容量翻倍”的产品策略,与AI模型参数规模的增长曲线形成了共振,为下一阶段产品的放量埋下基础。

当参数不再决定胜负,AI时代的企业级SSD靠什么「赢」?|MemoryS 2026

SSD的竞争核心是让GPU「不空转」

 当SSD开始承担KV Cache卸载、AI数据湖、推理缓存等任务,它既要提供接近内存级的延迟稳定性,又要具备远高于内存的容量密度和成本优势。

在这种变化下,SSD的评价体系也随之重构。

过去行业更强调带宽、IOPS与寿命,在AI场景中,长尾延迟控制、QoS一致性以及每瓦性能开始变得同样关键。

对大型算力集群来说,一块SSD的价值不只是单盘性能有多高,而在于它能否在复杂负载下保持稳定响应,避免GPU因等待I/O而“空转”。

也正是在这样的背景下,企业级存储厂商开始向系统能力延伸。

以忆恒创源为例,其核心策略并不是简单堆叠硬件参数,而是通过固件算法和系统级调度,把不同来源的控制器与NAND颗粒调校成更适合AI负载的产品形态。

在大规模线上部署中,依托国内大规模、高度复杂的AI与互联网生态,在极端且高频的业务压力下,其SSD的平均无故障时间(MTBF)已经达到约1500万小时,产品的稳定性有可观的场景及数据背书。

在AI负载环境下,通过固件调度优化和延迟控制,其随机读延迟可以压缩至50微秒级,从而减少推理场景中GPU等待I/O的时间。

并且,通过对固件和硬件架构的协同优化,高密度QLC在AI数据湖和推理场景中既能提供更大的容量密度,也能维持稳定的性能表现。

对于需要存储海量训练数据或推理缓存的集群而言,这类产品正在成为实现“全闪数据中心”的关键一步。

当参数不再决定胜负,AI时代的企业级SSD靠什么「赢」?|MemoryS 2026

AI重构存储路径:企业级SSD从「容量介质」转向「算力系统变量」

在这一轮由 AI 推动的存储重构中,一个更清晰的共识正在形成:企业级SSD的价值锚点,正在从“单点性能指标”转向“系统确定性”。

无论是KV Cache大规模卸载带来的架构迁移,还是QLC在高密度存储中的重新定位,抑或是固件层对延迟、QoS 与功耗的持续压缩,本质上都在指向同一个问题:存储不再只是容量与带宽的提供者,而是决定算力是否能够被稳定释放的基础变量。

在这个意义上,行业的竞争边界也在悄然上移。

单一硬件能力的差异正在被系统级能力所稀释,真正拉开差距的,是谁能更早理解AI工作负载的变化,并将其转化为可规模化、可持续优化的工程体系。

当算力、存储与网络进一步融合,数据中心的逻辑也将从“资源堆叠”走向“效率组织”。

而存储,正站在这一轮重构的交汇点上。

雷峰网原创文章,未经授权禁止转载。详情见转载须知

相关推荐
“声智融合、智启未来”全场景语音AI技术与产业发展战略研讨会在北京大学成功召开,开启语音交互的未来生活方式 科技  雷锋网 ⋅  15阅读 ⋅  3小时前
独家丨大疆首款全景无人机上市以来全球出货量超12.5万台,市占率超98% 科技  雷锋网 ⋅  6阅读 ⋅  13小时前
自动跟价再打八折引商家不满,京东采销怒斥:可去竞对平台寻找机会;Meta 计划全球裁员约7800人,AI转型引员工抗议;马斯克告OpenAI败诉 科技  雷锋网 ⋅  12阅读 ⋅  13小时前
代码驱动的视觉感知:为什么说「看得懂代码」才是大模型攻克理科题的真正钥匙 |CVPR 2026 科技  雷锋网 ⋅  6阅读 ⋅  13小时前
Ozon Global调研:超七成俄买家认可中国商品质量改善,评价超越价格成首选中国商品依据 科技  雷锋网 ⋅  6阅读 ⋅  13小时前
Figure机器人直播干活一整天,效果越惊艳,质疑越凶猛 科技  雷锋网 ⋅  12阅读 ⋅  1天前
果粉大喜!苹果深夜官宣降价:iPhone17Pro进入6000元档 ;传前华为车BU总裁被架空,千里科技高层震荡持续;虎鲸文娱旗下妙鸭相机团队解散 科技  雷锋网 ⋅  16阅读 ⋅  1天前
京东上海总部大楼「歪」了?最新通报:涉事工地已停工;话费直接扣?三大运营商齐发Token服务;卢伟冰:下半年不少国产旗舰手机将超万元 科技  雷锋网 ⋅  11阅读 ⋅  1天前
对话关梦龙:他想用 Agent 拯救你手机里的 100G 废片 科技  雷锋网 ⋅  9阅读 ⋅  1天前
一封律师函引发的GitHub风暴:拓竹为何惹毛了全球极客? 科技  雷锋网 ⋅  11阅读 ⋅  1天前