DeepSeekV4即将发布:AI编程能力或超OpenAI GPT及Anthropic Claude
创始人
2026-01-21 08:57:03
0

1月21日,据The Information月初爆料,DeepSeek计划在2月中旬农历新年期间推出新一代旗舰AI模型——DeepSeekV4,该模型将具备更强的写代码能力。1月20日,DeepSeek-R1发布一周年之际,开发者在GitHub中发现DeepSeek更新了一系列FlashMLA代码,涉及114个文件中的28处提到了未知的“MODEL1”大模型标识符。该标识符与现有的“V32”(即DeepSeek-V3.2)并列或区别提及,暗示“MODEL1”可能代表一个新架构模型。

代码分析显示,“MODEL1”与“V32”在关键技术上存在差异,主要体现在键值(KV)缓存布局、稀疏性处理方式以及对FP8数据格式的解码支持等方面。这些差异表明新架构可能在内存优化和计算效率上进行了针对性设计。此外,DeepSeek研究团队还发布了两篇技术论文,介绍了名为“优化残差连接(mHC)”的新训练方法和一种受生物学启发的“AI记忆模块(Engram)”。用户猜测,DeepSeek正在开发的新模型可能会整合这些最新研究成果。

相关内容

热门资讯

理想汽车OTA8.2升级:40... 1月21日,理想汽车发布了OTA8.2版本更新,涉及智驾、舒适、交互等多个维度,共计40项新功能。在...
“违规拆机电池充斥市场,续航翻... 近日,工信部等六部门联合发文,明确禁止废旧动力电池用于电动自行车等领域,并取消了“梯次利用”概念,推...
日产NX8即将上市:800V超... 近日,东风日产宣布旗下全新SUV日产NX8即将在3-4月份上市。NX8基于天演架构打造,首发搭载80...
理想汽车OTA8.2升级:40... 1月21日,理想汽车宣布其OTA8.2版本软件更新已开始向用户推送。此次更新带来了40项新功能,包括...
阿里千问模型全球领先,衍生模型... 1月21日,全球最大AI开源社区HuggingFace最新数据显示,阿里巴巴的千问大模型衍生模型数突...
有“大湾鸡”嘉年华!广州8家公... 1月21日,广州市政府新闻办召开“广州过年 花城看花”——“年味最广州”2026年春节期间文旅活动新...
广州流溪河成“两栖乐园”,珍稀... 在广州北部,被誉为“城市后花园”的流溪河国家森林公园里,悄悄住着一群神秘的“两栖精灵”。近年来,公园...
(走进中国乡村)从“冬眠”到“... 中新社江西庐山1月21日电 题:从“冬眠”到“冬旺”:庐山牯岭解锁文旅新图景作者 朱莹大寒节气已至,...
中国充电桩突破2000万大关,... 1月21日,国家能源局发布数据显示,截至2025年12月底,我国电动汽车充电基础设施(枪)总数达到2...
红旗全固态电池首车下线,202... 近日,中国一汽研发总院宣布,红旗品牌自主研发的全固态电池首台样车成功试制下线,这标志着红旗在全固态电...