最新文摘 生活资讯 经  济 健康饮食 科技数码 家庭教育  
 
首页 > 报刊文摘> 科技数码 >从DeepSeek V4发布看大模型行业

从DeepSeek V4发布看大模型行业

加入时间:2026-06-25 15:10    访问量:34    信息来源: 南风窗 2026年10期

  20264月,几乎所有中美一线大模型公司都密集发布了新模型,是观察行业大趋势的绝佳窗口。最受瞩目的中国模型,当属DeepSeekV4预览版。一年多前的全球爆火余温犹在,它在美国社交媒体上的热度,也不输前一天发布的GPT-5.5和月中发布的Claude Opus 4.7,技术论坛Hacker News上它的讨论甚至压过了后两者。

  V4的常规信息各家媒体已经讲过,下面结合技术报告的几个细节,谈谈业内人关心的几个问题。

  第一,大模型现在哪家强?

  评估大模型就像评估人,需要长期共事、至少多轮面试才看得清。普通用户最靠谱的方式,还是在自己工作中多用、多与同行交流。

  大模型公司之间互相怎么评价也很值得参考。V4技术报告里重点横向对比的,国外是ClaudeGPTGemini,国内是智谱GLM与月之暗面Kimi;专项任务上,中文写作比较了Gemini,代码与白领工作比较了Claude

  这次V4效果不算惊艳,国内与智谱、Kimi在同一水平线(代码能力的实际使用反馈甚至略逊),与国外相比,技术报告坦承“大约落后最先进前沿模型36个月”。但DeepSeek总体守住了自己的位置——这与业内共识一致:全球一线大模型,中美各三家,中国总体落后美国几个月。

  而一年多前V3技术报告里重点对比的国外模型还是GPTClaudeLlama,国内则是阿里千问。一年时间,格局变化不小。

  第二,大模型的发展方向,有共识了吗?

  一年多前R1爆火时,业界对方向并无共识:很多人认为推理模型是预训练之后的新阶段,谷歌押注原生多模态。Claude的混合模式异军突起、成为今天的主流,证明智能体(Agent)、推理(Reasoning)、代码(Coding),简称ARC,以及凭借这些能力解决的高价值任务,才是兵家必争之地。

  Anthropic在收入和二级市场估值上都已经超过行业开创者OpenAIOpenAI在狂追;马斯克因为ARC能力没做好,xAI创始团队几乎全员出走;谷歌也再次告急。国内智谱、Kimi都抓住了这一战略机遇,token供不应求。

  V4技术报告的关键词是“高效的长上下文”,出发点正是解决ARC类长时段任务的瓶颈。除ARC外,下一个能扭转大势的战略方向、下一个大模型能攻克的高价值任务场景是什么?值得深思。

  最后,谈谈AI领域的中国式自信。

  V4技术报告引用的重要论文中,国内来源的比例明显增加:除DeepSeek自己的工作外,还包括月之暗面规模化的Muon优化器、由字节跳动Hyper-Connections发展而来的mHC,底层算子用的Tile语言则来自北大。智谱GLM5技术报告也重点引用了DeepSeekDSA架构。更引人注目的是,DeepSeek在底层优化中与华为昇腾芯片做了深度协同(V4主要仍在英伟达芯片上训练)。

  与美国大模型公司之间连牵手都难以形成对照,中国在大模型基础研究上正逐渐形成自己的生态,年轻的从业者也越来越自信。V4发布博客的结尾引用了荀子《非十二子》——“不诱于誉,不恐于诽,率道而行,端然正己”。在2026年这场日益白热化的大模型竞赛中,这份从容尤其珍贵。

上一条:是谁在你的聊天机器人耳边低语?

【返回】【顶部】【关闭】