2月27日,据路透社报道,DeepSeek在即将进行的重大模型更新前,未向美国芯片制造商展示其旗舰模型,而是向国内供应商,包括华为技术有限公司,提供了早期访问权限。这一做法打破了AI开发者通常将主要模型预发布版本分享给英伟达和AMD等芯片制造商的行业标准做法,以确保软件在广泛使用的硬件上高效运行。DeepSeek此前与英伟达技术人员有密切合作,但此次未向英伟达和AMD提供访问权限,而是给予中国厂商几周时间来适配其芯片。
DeepSeek正在测试V4Lite模型,代号“Sealion-lite”,上下文窗口为100万tokens,并原生支持多模态推理。本月早些时候,DeepSeek更新后开始灰度测试最高1M Token的上下文长度。同时,DeepSeek的知识库已更新至2025年5月,非联网状态下可准确输出2025年4月的新闻。
