DeepSeekV4即将发布:AI编程能力或超OpenAI GPT及Anthropic Claude
创始人
2026-01-21 08:57:03
0

1月21日,据The Information月初爆料,DeepSeek计划在2月中旬农历新年期间推出新一代旗舰AI模型——DeepSeekV4,该模型将具备更强的写代码能力。1月20日,DeepSeek-R1发布一周年之际,开发者在GitHub中发现DeepSeek更新了一系列FlashMLA代码,涉及114个文件中的28处提到了未知的“MODEL1”大模型标识符。该标识符与现有的“V32”(即DeepSeek-V3.2)并列或区别提及,暗示“MODEL1”可能代表一个新架构模型。

代码分析显示,“MODEL1”与“V32”在关键技术上存在差异,主要体现在键值(KV)缓存布局、稀疏性处理方式以及对FP8数据格式的解码支持等方面。这些差异表明新架构可能在内存优化和计算效率上进行了针对性设计。此外,DeepSeek研究团队还发布了两篇技术论文,介绍了名为“优化残差连接(mHC)”的新训练方法和一种受生物学启发的“AI记忆模块(Engram)”。用户猜测,DeepSeek正在开发的新模型可能会整合这些最新研究成果。

相关内容

热门资讯

小米SU7内饰大革新:豪华舒适... 3月20日,小米集团在春季新品发布会上推出了新一代SU7车型,该车型在内饰设计上进行了重大革新,旨在...
全球首次!太空算力远程操控地面... 3月19日,国星宇航宣布,其与上海交通大学太空计算联合实验室基于开源智能体“龙虾”OpenClaw,...
小米2026春季新品发布:SU... 3月19日,小米在春季新品发布会上推出了新一代小米SU7汽车,小米笔记本Pro14和小米手表S5。新...
这份榜单亮了:中国上升9位,美... 中新网3月19日电 近日,英国“品牌金融”咨询公司发布《2026年全球软实力指数》报告,中国以评分7...
外交部:敦促日方不要在错误的道... 中新网北京3月19日电 (记者 张蔚然)中国外交部发言人林剑19日主持例行记者会。有记者提问:美国...
揭阳一男童走失后独自穿行县道,... 3月14日11时许,正值午间送餐高峰期,广东省揭阳市揭东区美团外卖骑手倪龙彬像往常一样奔波在路上。当...
响应“招商引资年”,广州海珠赤... 广州市确立2026年为“招商引资年”。 为积极响应广州市、海珠区全年全员招商的工作部署,抢抓发展机遇...
“两新”政策持续显效 激发消费... 央视新闻客户端消息(新闻联播):各地结合实际细化举措,持续提升“两新”政策效能,有力拉动内需,激发消...
微信安全中心严打AI生成违规链... 3月19日,微信安全中心发布《针对滥用人工智能生成内容服务传播恶意链接的治理公告》。公告指出,黑灰产...
小米SU7上市34分钟锁单1.... 3月19日,小米汽车新一代SU7正式上市,市场反响热烈。仅34分钟内,锁单量就达到了1.5万台,显示...