DeepSeek-V4上线:大模型技术突破,重塑词元经济与算力产业格局
艾媒网(iimedia.cn)获悉,4月24日,深度求索公司正式发布DeepSeek-V4预览版并同步开源。新系列包含Pro、Flash两款MoE版本,均原生支持1M超长上下文。其中Pro版总参数达1.6万亿,在Agent能力、世界知识和推理性能上比肩顶级闭源模型;Flash版主打高性价比,每百万tokens输入(缓存命中)定价0.2元、输出2元。模型还创新了注意力机制,在Token维度实现压缩优化,有效降低了计算与显存需求。
DeepSeek-V4的发布,既体现了其在参数与上下文窗口的核心突破,也印证了大模型向更大参数、更长上下文的演进路径,这一趋势正直接驱动词元经济爆发式增长。iiMedia Research(艾媒咨询)发布的《2026年中国词元经济产业链全景分析报告》数据显示,2025年中国词元调用总量达24619.3万亿次,预计2026年增至111799.5万亿次,2030年攀升至7046680.4万亿次,2025—2030年复合增长率高达210%。而词元调用量的爆发式增长,根源正是模型参数与上下文窗口的突破带来的应用场景拓展,这种突破也正深刻改变着AI应用的形态。
市场规模通常保持每年更新;如若更新,艾媒数据中心将第一时间发布,点击查看最新内容 ↓↓↓
具体而言,1.6万亿参数配合1M超长上下文,让模型能够处理整部书籍级别的信息,也为智能体等需要多步推理的复杂任务提供了更充裕的推理空间。不同于传统大模型多聚焦于对话生成,新一代模型正逐步演变为自主执行复杂任务的智能体大脑,单次任务消耗的词元量也随之大幅攀升,进一步放大了词元经济的规模效应,这种规模效应的凸显,也同步传导至算力供给侧。
词元消耗的增加源于模型参数提升与上下文窗口延长带来的算力需求激增,这直接推高了模型训练与推理的算力成本,近期多家头部云厂商密集调整AI服务定价,便直观反映了大模型迭代升级带来的成本上行压力。高端GPU、高带宽内存等核心硬件供给持续紧缺,叠加数据中心能耗成本刚性上涨,共同推高了商用算力服务定价,而算力供需格局的这一变化,也进一步推动了AI服务计费模式的精细化升级。
这种计费模式的精细化,最直观的体现便是不同模型的差异化定价策略。DeepSeek-V4的Flash版以高性价比定价,Pro版瞄准高性能需求,精准顺应了词元经济下不同应用场景对成本与效率的差异化要求。与此同时,更多模型厂商开始采用Token计价,使AI服务转变为可计量、可标准化定价的数字化产品,为行业商业化发展提供了更清晰的路径。
综合来看,DeepSeek-V4的发布是大模型向更大规模、更强能力演进的缩影。其在参数与上下文上的持续突破,正推动词元需求呈量级增长,重塑算力产业链的供需关系与定价逻辑,并加速AI应用向智能体、长上下文等复杂任务场景渗透。随着更多高性能模型涌现,词元经济的规模效应将进一步释放,算力产业链与AI应用生态的协同演进也将持续深化。