DeepSeekV4即将发布:AI编程能力或超OpenAI GPT及Anthropic Claude
创始人
2026-01-21 08:57:03
0

1月21日,据The Information月初爆料,DeepSeek计划在2月中旬农历新年期间推出新一代旗舰AI模型——DeepSeekV4,该模型将具备更强的写代码能力。1月20日,DeepSeek-R1发布一周年之际,开发者在GitHub中发现DeepSeek更新了一系列FlashMLA代码,涉及114个文件中的28处提到了未知的“MODEL1”大模型标识符。该标识符与现有的“V32”(即DeepSeek-V3.2)并列或区别提及,暗示“MODEL1”可能代表一个新架构模型。

代码分析显示,“MODEL1”与“V32”在关键技术上存在差异,主要体现在键值(KV)缓存布局、稀疏性处理方式以及对FP8数据格式的解码支持等方面。这些差异表明新架构可能在内存优化和计算效率上进行了针对性设计。此外,DeepSeek研究团队还发布了两篇技术论文,介绍了名为“优化残差连接(mHC)”的新训练方法和一种受生物学启发的“AI记忆模块(Engram)”。用户猜测,DeepSeek正在开发的新模型可能会整合这些最新研究成果。

相关内容

热门资讯

宝马财报超预期,CEO对美关税... 5月7日,宝马集团宣布维持2026年的财务指引,尽管第一季度利润下降25%,但业绩仍好于市场预期。宝...
理想L9Livis革新5C增程... 5月7日,理想汽车CEO李想通过微博分享了即将发布的全新理想L9Livis的核心卖点。李想指出,新车...
特斯拉Cybercab电动卡车... 近日,特斯拉Semi电动半挂卡车被捕捉到装载Cybercab驶离得州超级工厂,标志着这款双人自动驾驶...
捷豹Type00电动GT跑车即... 5月6日,汽车媒体AutocarIndia报道,捷豹计划于5月12日公布其Type00电动GT跑车的...
比亚迪领汇e9即将上市,5分钟... 5月7日,比亚迪旗下品牌领汇汽车宣布,其第二款车型领汇e9将于5月9日上市。领汇e9搭载了比亚迪的闪...
韩国SEMIFIVE联手寒序科... 5月7日,韩国SEMIFIVE公司宣布与中国寒序科技(ICYTech)合作,成功流片了一款采用三星晶...
问界M7Pro+升级城区智能驾... 5月7日,问界M7Pro+车型迎来了重要的功能升级,正式支持城区领航辅助NCA功能,使得日常城市驾驶...
雷克萨斯旗舰纯电SUV TZ冬... 5月7日,雷克萨斯宣布其旗舰纯电SUV车型TZ将于今年冬季在日本和北美市场上市。新车延续品牌最新理念...
腾讯联合UCLA发布OpenS... 5月7日,腾讯混元(TencentHunyuan)联合加州大学洛杉矶分校(UCLA)、香港中文大学等...
雷克萨斯发布全新纯电SUV:5... 今日,雷克萨斯公布了其全新纯电动三排座SUV车型——TZ。新车的车长达到5.1米,轴距为3.05米,...