“欧洲AI巨头Mistral被指抄袭中国DeepSeek技术,引发争议!”
创始人
2026-01-26 13:59:51
0

近日,欧洲版OpenAI CEO Arthur Mensch的言论引发了广泛讨论。他在访谈中表示,中国开源AI的强势发展得益于Mistral公司发布的开源模型,特别是DeepSeek-V3是基于Mistral提出的架构构建的。这一言论遭到了网友的质疑,他们指出DeepSeek-V3和Mistral的架构实际上思路并不相同。

具体来说,Mistral的Mixtral论文与DeepSeek-V3的论文虽然发表时间仅相差3天,但研究方向和出发点存在差异。Mixtral侧重于证明强大的基础模型结合MoE技术可以超越更大的稠密模型,而DeepSeek则更注重算法创新,旨在解决传统MoE中专家“学得太杂”和“重复学习”的问题。在架构设计上,DeepSeek通过细粒度专家分割和共享专家的概念,实现了更精准的知识习得和知识分布的解耦。

此外,有网友指出,Mistral 3 Large实际上直接沿用了DeepSeek-V3的架构,而Mistral的论文并未详细说明训练细节。这引发了关于Mistral对MoE技术贡献的讨论,以及对Arthur Mensch言论的质疑。尽管如此,DeepSeek在稀疏MoE、MLA等技术上的影响力不容忽视,而围绕基础模型的竞争仍在继续。

相关内容

热门资讯

北汽新能源“方盒子”硬派越野车... 近日,多位博主分享了鸿蒙智行享界品牌越野车型的伪装车谍照。谍照背景中出现了“北汽新能源XXXX工厂”...
一季度中国软件业收入增11.6... 5月7日,工信部官方微信公众号发布数据显示,2026年一季度我国软件和信息技术服务业收入达34920...
Adobe Acrobat新增... Adobe于5月6日宣布在Acrobat中推出PDFSpaces分享功能,该功能旨在将静态材料转化为...
鸿蒙智界V9预售火爆,72小时... 近日,鸿蒙智行旗下首款MPV智界V9开启预售,起售价39.98万元,顶配价格52.98万元。智界V9...
别克至境E7两周销量破5000... 5月6日,别克汽车官方宣布,至境E7上市两周累计交付量已突破5000台,其中“有孩家庭”占比超过80...
电竞潮燃“五一”,电竞粤超东莞... 羊城晚报讯 记者陈旭泽报道:5月5日,2026广东省电子竞技超级联赛(以下简称“电竞粤超”)城市巡回...
广东多所高校探索“艺科融通”复... 文/羊城晚报全媒体记者 秦小杰图/受访者提供近日,广东多所专业类高校密集举办系列活动,深入探索艺术与...
两名“红领巾”的跨国相遇!越南... 文/羊城晚报全媒体记者 张小悦图/通讯员 岳青“He is my best friend!(他是我最...
华晨宇直播哭了,发文致歉 4月22日晚,歌手华晨宇发文致歉,在云南举办的火星乐园2.0因不可抗力延期。全文如下:火星乐园2.0...
广州荔湾多宝街道:空间挖潜+数... 文/羊城晚报全媒体记者 梁怿韬 通讯员 成广聚 陈梓佳图/通讯员提供空间狭窄,是地处老城区的广州市荔...