智通财经APP获悉,摩根大通称,DeepSeek V3.2发布标志中国AI市场迎第二波“DeepSeek冲击”,意味着以中国国内适中的价格即可获得接近前沿模型的开源推理能力,利好中国AI生态的大多数利益相关者,即云运营商、AI芯片制造商、AI服务器制造商、AI智能体平台和SaaS ...
但每个人,也深有期待 V3.2 的性能已经追平 GPT-5 和 Gemini 3.0 Pro,而且开源 V3.2 和顶级闭源模型的 benchmark 对比,来自 DeepSeek V3.2 技术报告 接下来,让我们一起完整看看 DeepSeek 从 V3 到 V3.2 的演进过程中,看看每个版本改了什么,为什么改,以及怎么实现的 内容 ...
DeepSeek 发布 DeepSeek-V3.2,这是一个开源的推理和代理 AI 模型家族。在多项推理基准测试中,其高性能计算版本 DeepSeek-V3.2-Speciale 表现优于 GPT-5,与 Gemini-3.0-Pro 相当。 DeepSeek 在开发 DeepSeek-V3.2 时应用了三项新技术。首先,他们使用了一种更高效的注意力机制 ...
前者聚焦平衡实用,适用于日常问答、通用Agent任务、真实应用场景下的工具调用。 推理达GPT-5水平,略低于Gemini-3.0-Pro。 后者主打极致推理,推理基准性能媲美Gemini-3.0-Pro。 还一把斩获IMO 2025、CMO 2025、ICPC World Finals 2025、IOI 2025金牌。 划重点,ICPC达到人类选手 ...
🤖头图由AI生成 智东西 作者 | 王涵 编辑 | 冰倩 智东西3月25日报道,今天,北大系AI编程创企硅心科技(aiXcoder)推出轻量级模型aiX-apply-4B,该模型支持256K上下文,参数量仅4B,一张消费级显卡即可部署。 该模型适用于企业级的代码修改场景,可自动识别修改意图、定位目标区域、保持原有格式与上下文结构,并将修改后代码应用到原始文件中。 基准测试方面,aiX-apply ...
在技术日新月异的今天,北大系的创企硅心科技(aiXcoder)于3月25日推出了其最新的轻量级AI编程模型——aiX-apply-4B。这款模型不仅支持256K的上下文处理,其参数量仅为4B,而且在一张消费级显卡上即可高效运行,极大降低了企业部署AI的门槛。
V3.2在工具调用能力上达到当前开源模型最高水平,大幅缩小了开源模型与闭源模型的差距。作为DeepSeek首个将思考融入工具使用的模型,V3.2在“思考模式”下仍然支持工具调用。公司通过大规模Agent训练数据合成方法,构造了1800多个环境、85000多条复杂指令的 ...
前言: 近日,DeepSeek的一场突发更新,这个以代码生成和硬核推理著称的[极客首选],一口气抛出两款正式版模型DeepSeek-V3.2与DeepSeek-V3.2-Speciale。 不仅在推理能力上对标GPT-5、硬刚Gemini 3.0 Pro,更以完全开源的姿态,直接打破了[开源模型永远落后闭源8个月]的行业 ...
2025年底,Google DeepMind与DeepSeek先后发布新一代模型——Gemini 3 Pro与DeepSeek V3.2。二者虽均采用MoE架构,却在技术路线上展现出深刻分化。本文基于权威基准测试与架构深度解析,揭示Gemini 3 Pro在深度推理能力、多模态融合、长上下文窗口、智能体可靠性、输出效率 ...
此次曝光源于DeepSeek对其开源推理加速库FlashMLA的更新。在横跨114个文件的代码变动中,出现了28处“MODEL1”标识符,其技术路径与现有的V32(即DeepSeek-V3.2)架构存在显著差异,暗示这是一个经过彻底重构的新设计。 近日, DeepSeek在GitHub上的代码库更新中,意外 ...
回溯罗福莉的成长史,“逆袭”是贯穿始终的关键词。这位来自四川宜宾的姑娘,小学时成绩排名靠后,通过制定阶段性目标逐步成为尖子生;进入北京师范大学计算机系后,她从班级后30名逆袭至保研北大;在北大语言计算实验室实习时,她从连Python都不会的“菜鸟”成长为唯一保研者。这些经历或许能解释她对“天才少女”标签的抗拒——“被称作天才,抹杀了一路的努力,也抹杀了我最大的优势。” ...
还没吃上瓜的家人们别着急,咱们从头捋一捋这事儿: 在最近一次访谈中,当被问到如何看待中国开源AI的强势发展时,Mistral联合创始人、CEO Arthur Mensch这样回应: 中国在AI领域实力强劲。我们是最早发布开源模型的公司之一,而他们发现这是一个很好的策略。