DeepSeek-V4模型震撼发布:参数量最大开源模型登场,引领AI新纪元
创始人
2026-04-25 04:01:19
0

4月24日,DeepSeek公司宣布推出其新一代基础模型DeepSeek-V4,该模型已在官网、官方App和API服务中上线,并已同步开源。DeepSeek-V4分为Pro和Flash两个版本,其中Pro版本以1.6T的总参数量和49B的激活参数,成为目前参数量最大的开源权重模型。Flash版本则以284B的总参数量和13B的激活参数,提供更快响应和更具成本效益的API服务。两个版本的模型均具备百万字的上下文容量,标志着在处理大规模文本数据方面迈出了重要一步。

DeepSeek-V4的Pro版本以其庞大的参数量,能够处理更为复杂的数据和任务,适合需要深度学习和复杂模型训练的场景。而Flash版本则以其较小的参数量和快速响应能力,适合需要快速处理和成本敏感的应用。两款模型的上线,不仅为用户提供了更多的选择,也推动了开源模型技术的发展,为人工智能领域的研究和应用提供了新的工具。

相关内容

热门资讯

豆包大模型2.1系列发布,引领... 6月23日,字节跳动旗下火山引擎在北京举办2026夏季FORCE原动力大会,发布豆包大模型2.1系列...
晶采观察丨100秒讲透关键词 ... 今年端午假期,全国1.24亿人次出游,文旅市场热度不减。然而,细究其文化动因,很多人所追逐的并非一般...
沿青藏铁路 看“天路”传奇丨追... 编者按:青藏铁路,从西宁启程,途经格尔木,直至拉萨。1956公里的路程,穿越多年冻土,翻越昆仑山脉,...
上海的AI,为什么跑去新疆“上... 近期,上海首次实现跨越3000多公里的异构算力调度,将部分AI计算任务转移至新疆克拉玛依,并利用当地...
新华解码|未来五年,新型能源体... 新华社北京6月25日电 题:未来五年,新型能源体系这样建设新华社记者王悦阳国家发展改革委、国家能源局...
南方日报评论员:矢志建功立业,... 文 | 南方日报评论员6月25日,全省“两优一先”表彰大会在广州召开。我们向受到表彰的130名广东省...
世界经济论坛首席技术官:中国A... 新华社大连6月25日电(记者郭洋 俞懋峰 刘艺淳)世界经济论坛第十七届新领军者年会(夏季达沃斯论坛)...
看“青州微笑”,感受苦难中淬炼... 文/图 羊城晚报全媒体记者 李娇娇 何文涛一千五百年前,北朝工匠在石头上勾勒出一抹笑痕;三十年前,龙...
广东出台脑机接口发展行动计划 ... 文/羊城晚报全媒体记者 黎秋玲近日,中共广东省委科技委员会办公室印发《广东省脑机接口科技与产业协同发...
以荔为媒,马业赋能!广州从化用... 在广东深入实施“百千万工程”、香港赛马会从化马场即将举办常规性国际标准速度赛马赛事之际,广州从化荔枝...