OpenAI 危!DeepSeek 放大招:追平谷歌最强,手撕 GPT-5 High

作者:新智元日期:2025/12/2

「【新智元导读】「开源之神」DeepSeek 重磅发布 V3.2 正式版,性能全面超越 GPT-5 High,与谷歌 Gemini-3.0 Pro 平分秋色。新模型不仅斩获 4 项国际奥赛金牌级成绩,更凭借独创的 DSA 稀疏注意力架构,打破「速度、成本、智能」的不可能三角。」

OpenAI 这次真的要慌了!

就在刚刚,「源神」DeepSeek 开源了 DeepSeek-V3.2 正式版——

在数学编程等多项推理基准上,全面超越 GPT-5 High,优于 Claude 4.5 Sonet;

与刷屏的 Gemini 3.0 Pro 相比,则难分伯仲,不相上下!

表 1:DeepSeek-V3.2 与其他模型在各类数学、代码与通用领域评测集上的得分(括号内为消耗 Tokens 估计总量)

在今年,DeepSeek 此前已发布 7 款模型——「开源之神」,当之无愧:

DeepSeek‑R1、DeepSeek‑R1‑Zero

DeepSeek‑V3、DeepSeek‑V3.1、DeepSeek‑V3.1-Terminus、DeepSeek‑V3.2‑Exp

DeepSeek‑OCR、DeepSeek‑Math-V2

「出手即王炸」

「开源 4 项奥赛金牌级 AI」

全新模型 DeepSeek-V3.2,出手即王炸。

DeepSeek 正式发布 DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale——专为智能体打造的推理优先模型!

  • DeepSeek-V3.2:V3.2-Exp 的官方迭代版本,现已登陆 App、网页端及 API;
  • DeepSeek-V3.2-Speciale:突破推理能力边界,目前仅通过 API 提供服务。

两款模型均达到世界级推理性能 :

  • V3.2:推理能力与文本长度兼顾,拥有 GPT-5 级别性能,适合日常驱动;
  • V3.2-Speciale:极致推理能力,取得了 4 项金牌级成绩;目前仅提供 API 版本(不支持工具调用),以支持社区评估与研究。

「在主流推理基准测试上,DeepSeek-V3.2-Speciale」 的性能表现媲美 Gemini-3.0-Pro(见表 1)。

更令人瞩目的是,V3.2-Speciale 模型**「成功斩获多项金牌:」**

  • 「IMO 2025(国际数学奥林匹克)」
  • 「CMO 2025(中国数学奥林匹克)」
  • 「ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)」
  • 「IOI 2025(国际信息学奥林匹克)」

其中,ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平。

而 DeepSeek-V3.2 是首个将思考直接整合到工具使用中的模型,同时支持在思考和非思考模式下使用工具。

目前,两款模型均已开源:

· DeepSeek-V3.2

HuggingFace:huggingface.co/deepseek-ai…

DeepSeek-V3.2

ModelScope:modelscope.cn/models/deep…

· DeepSeek-V3.2-Speciale

HuggingFace:huggingface.co/deepseek-ai…

ModelScope:modelscope.cn/models/deep…

「从「引擎验证」到「全能车手」」

「DeepSeek V3.2 的进化论」

如果说两个月前发布的 DeepSeek-V3.2-Exp 是一台在赛道上呼啸而过的「概念车」,用来向世界证明「稀疏注意力」引擎的动力潜力;

那么今天正式转正的 DeepSeek V3.2,则是一辆完成了内饰精修、装配了顶级导航系统、可以随时上路解决复杂问题的「量产超跑」。

这就是 DeepSeek V3.2 相比于 Exp 版(实验版)最大的进化逻辑:「核心引擎不变,但驾驶技巧(Agent 能力)发生了质变。」

「V3.2 正式版 vs. Exp」

「学会了「边干边想」」

在架构层面,V3.2 沿用了 Exp 版本验证成功的 DSA 架构,但在「软实力」上,DeepSeek 解决了一个困扰 AI 界的顽疾——「思考与行动的断裂」

在 V3.2-Exp 时期(以及其他大多数推理模型),模型像是一个记性不好的老学究:它会先花很长时间思考,决定调用一个工具(比如搜索天气)。

但当工具把「今天是雨天」的结果扔回来时,它往往会「断片儿」,忘了刚才思考到哪一步了,不得不重新规划。

V3.2 正式版引入了「思维上下文管理」。

这就像给模型装了一个「工作记忆暂存区」。

现在的 V3.2 像一位经验丰富的外科医生,在伸手要手术刀(调用工具)的间隙,脑子里的手术方案依然清晰连贯,拿到刀后能无缝衔接下一步操作。

为了练就这项绝活,DeepSeek 甚至为 V3.2 搭建了一个「虚拟演练场」。

他们合成了 1800 多个虚拟的操作系统、代码库和浏览器环境,生成了 8.5 万条极其刁钻的指令,逼着 V3.2 在虚拟世界里反复练习「修 Bug」、「查资料」、「做报表」。

正是这种高强度的特训,让 V3.2 正式版从一个只会做题的「做题家」,进化成了能熟练使用工具解决现实难题的「实干家」。

「最大技术亮点」

「给注意力装上「闪电索引器」」

V3.2 能够同时兼顾「聪明」和「便宜」,其最大的功臣依然是那个名为稀疏注意力(DSA)的底层黑科技。

DeepSeek-V3.2 的注意力架构

要理解它的牛逼之处,我们得先看看传统模型有多「笨」。

传统模型在处理长文档时,就像一个强迫症晚期的图书管理员:

为了回答你一个简单的问题,它强迫自己**「必须把图书馆里每一本书的每一页、每一行字都读一遍」**,并计算它们之间的关联。

这导致计算量随着书的厚度呈指数级爆炸(O(L^2))。

DSA 则给这位管理员配备了一套「闪电索引器」。

当问题来临时,DSA 先用极低的成本扫描一遍「索引」,瞬间判断出哪几页书可能包含答案,把无关的 99% 的废话直接扔掉。

然后,它只对这筛选出的 1% 的关键内容进行精细的深度阅读。

这种「查目录」而非「死磕全书」的策略,将计算复杂度从可怕的指数级直接拉低到了近乎线性(O(L))。

「带来的显著提升」

「打破「不可能三角」」

DSA 技术的成功落地,直接击穿了 AI 领域的「速度、成本、智能」不可能三角。

其一,成本腰斩,长文无忧。

对于用户来说,丢给模型一本几十万字的小说或代码库,不再是「烧钱」的奢侈行为,处理速度也从「泡杯咖啡」变成了「眨眼之间」。

其二,算力盈余带来的「智力涌现」,这是最精彩的一点。

正因为 DSA 节省了大量算力,DeepSeek 才有底气推出那个恐怖的 Speciale 版本。

既然读得快,那就让它想得久一点!

Speciale 版本利用节省下来的资源,进行更深度的「长思考」和逻辑推演。

结果是震撼的:DeepSeek-V3.2-Speciale 在数学(IMO 金牌)、编程(IOI 金牌)等硬核指标上,不仅超越了 GPT-5 High,更是与谷歌最强的 Gemini 3.0 Pro 战成平手。

从验证 DSA 引擎潜力的 V3.2-Exp,到将 Agent 能力、思维上下文管理、虚拟演练场训练全部装车的 V3.2 正式版,DeepSeek 展示的是另一条通往强智能的路线:在算力紧箍咒下,用更聪明的架构、更精细的训练和更开放的生态,撬动推理极限。

「DeepSeek-V3.2 的横空出世,正是 DeepSeek 开源」 「AI」 「的魅力时刻:拒绝无脑烧钱 Scaling,靠更聪明的「算法」,在算力的缝隙中开辟出通往顶峰的捷径。」

参考资料:

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理


OpenAI 危!DeepSeek 放大招:追平谷歌最强,手撕 GPT-5 High》 是转载文章,点击查看原文


相关推荐


浅谈C++与C语言二进制文件差异(从一次链接错误说起)
码事漫谈2025/11/30

"undefined reference to `func' ",这个看似简单的链接错误背后,隐藏着C与C++二进制文件的根本差异。很多开发者认为C++只是"C with Classes",却不知这对"亲密兄弟"在二进制层面早已分道扬镳。 在软件开发的演进历程中,C++作为C语言的延伸,始终保持着高度的语法兼容性。这种表面上的相似性却掩盖了两者在编译产物层面的深刻差异。本文将从二进制文件的视角,深入剖析C++与C语言在目标代码生成机制上的本质区别,揭示面向对象、泛型编程等高级特性在机器层面的实现


【已开源】Cursor AI 开发实战:小文件在线互传工具
极客密码2025/11/27

灵机一动 + Cursor + 几个小时 = 一个完整的文件传输工具!这就是 AI 编程的魅力~ 前言 大家好!今天给大家分享一次纯纯的 AI 开发实战。 周末在家闲着没事,突然想到平时工作中经常需要在设备间传文件,或者临时给朋友分享个东西。现有的工具要么太重(百度网盘、微信那种),要么不够安全(公开链接谁都能访问),要么就是要付费。 灵机一动:能不能做一个轻量级的临时文件传输工具? 然后打开 Cursor,开始和 AI 聊天,几个小时后,一个完整的项目就出来了 —— F2F.icu! 关键


LangChain / LLM 开发中:invoke() 与 predict() 的区别
吴佳浩2025/11/25

LangChain / LLM 开发中:invoke() 与 predict() 的区别 文章当中的1400等等协议内容大家不必在意这是我日常会用到的 大家主要了解就可以了 作者:吴佳浩 最后更新:2025-11-25 适用版本:LangChain v1.0+ 1. 为什么会有 invoke() 和 predict() 两个方法? 在 LangChain / LCEL / OpenAI ChatModel 开发中,你会看到同一个模型居然能同时调用: llm.predict(...) l


再来聊聊,Vue3 项目中 Pinia 的替代方案
前端布鲁伊2025/11/23

想获取更多2025年最新前端场景题可以看这里:fe.ecool.fun 大家好,我是刘布斯。 之前转载了一篇文章Vue 项目不要再用 Pinia 了,先不可否认,这文章有点标题党的意思。但这篇文章的主要观点是说,在中小项目里,用 Vue 3 自带的组合式 API(reactive / ref)来管状态,很多时候比硬上 Pinia 要香。 好家伙,评论区一下就热闹了,总结起来是:“Pinia 多好用,你肯定是没用明白 Pinia” 说实话,我确实有点意外。 我先摆明态度:Pinia 是个非常优秀的


2025.11.19 力扣每日一题
小白程序员成长日记2025/11/21

2154.将找到的值乘以2 这个题目比较简单,做的挺快的。 class Solution { public: int findFinalValue(vector<int>& nums, int original) { //1.对数组进行排序 sort(nums.begin(),nums.end()); //2.遍历排序后的数组 for (int num : nums) { //3.如果当前数字等于original


Windows开发:一场与指针的共舞,亦是超越它的征程
码事漫谈2025/11/19

当人们问“Windows开发导致指针吗?”或“Windows开发到底指针么?”,这背后其实是一个混合了技术困惑和职业好奇的复杂问题。简单来说,这个问题的内核是:Windows开发是否是一个整天与令人头疼的指针打交道的岗位? 答案是双重的:是的,深入理解指针是高级Windows开发的基石;但也不是,因为现代Windows开发已经在很大程度上帮助你管理指针,让你更专注于业务逻辑。 一、解码问题:什么是“Windows开发到底指针么?” 这个问题通常源于以下几点认知: 技术传说: C/C++是Win


rust语言,将JSON中的所有值以字符串形式存储到sqlite数据库中(逐行注释)
咸甜适中2025/11/18

主要功能实现: 所有json中数字转为字符串,保持精度不变巨大值 直接存储为字符串:3355446515156151516158.55125184845684值为列表:["egeggeg","gegeg",25.5] 存储为: ["egeggeg","gegeg","25.5"]值为字典:{"name":"小小","age":26} 存储为: {"name":"小小","age":"26"} 代码 use regex::Regex; use rusqlite::{Connection, Res


利用CMDB数据实现指标业务维度的动态扩展
可观测性用观测云2025/11/17

背景 很多客户已经建有 Prometheus/Zabbix 等采集方式,通常不会贸然替换 DataKit 进行直采,往往是通过 DataKit 去获取其它工具采集的结果。如 Prometheus remote write,Zabbix export 等。 为了增加不同数据类型的关联性,需要对已有的指标数据添加更多业务 TAG,如应用名,所属项目,部门等。为实现此类需求,需要能够获得原始的相关配置信息,如 CMDB 数据等。然后通过观测云 Pipeline 中的 refere_table() 方法


深入浅出 SQLSugar:快速掌握高效 .NET ORM 框架
q***2512025/11/16

SQLSugar 是一个高效、易用的 .NET ORM 框架,支持多种数据库(如 SQL Server、MySQL、PostgreSQL 等)。它提供了丰富的功能,包括 CRUD 操作、事务管理、动态表名、多表联查等,开发者可以通过简单的链式操作实现复杂的数据库逻辑。 本文将以完整的示例,详细介绍 SQLSugar 的安装、配置和功能使用,适用于 .NET Framework 和 .NET Core 项目。 一、SQLSugar简介 1. 什么是 SQLSugar? SQLSugar 是一个轻量


vscode编译C语言 | 在VSCode中配置编译环境与常见问题解决
epvikz_0732025/11/15

三十岁学编程|从零开始,如何在30岁起步学编程并成功转行许多人认为编程是年轻人的事情,尤其是到了三十岁,很多人会觉得自己已经错过了最佳学习的时机。然而,实际上三十岁学编程并非不可能,反而可能是一个崭新的开始。在这个信息化时代,编程能力已成为许多行业的基本技能,很多人通过自学编程成功转行,获得了新的职业发展机会。首先,学编程最重要的就是坚持和耐心。虽然编程看起来有些抽象,但通过系统的学习和实践,任何人都可以掌握基本的编程技能。比如,掌握Python或JavaScript等基础语言,它们不仅有着强大

首页编辑器站点地图

本站内容在 CC BY-SA 4.0 协议下发布

Copyright © 2025 聚合阅读