印度AI实验室发布30B和105B大语言模型,挑战谷歌GeminiFlash
创始人
2026-02-21 00:03:20
0

2月20日,印度AI实验室Sarvam在印度人工智能影响力峰会上发布了两款新一代MoE架构大语言模型。这两款模型将通过HuggingFace平台以开源权重的形式提供,同时将推出API访问和仪表盘支持。

Sarvam发布的两款新模型中,较小型号为30B-A1B设计,预训练数据集规模达16T,支持32K上下文窗口,主要面向低延迟的实时应用场景。规模较大的型号为105B-A9B设计,支持128K上下文窗口,适用于要求更为严苛的用例。Sarvam表示,其105B-A9B模型在本地化的印度语言基准测试中优于谷歌Gemini2.5Flash等竞争对手。在更广泛的工作负载中,其模型在大多数基准测试中优于DeepSeekR1,在许多基准测试中优于谷歌GeminiFlash。

相关内容

热门资讯

年轻民警化身“林海雪人” 在把... 吉林汪清位于东北虎豹国家公园核心区,林区面积6000多平方公里。为守护好这片林海和虎豹家园,2025...
特斯拉败诉需赔2.43亿美元!... 2月20日,美国联邦法官驳回了特斯拉试图推翻2.43亿美元陪审团裁决的请求。该判决与2019年佛罗里...
YouTube对话式AI工具全... 2月20日,YouTube宣布其对话式AI工具已正式支持电脑、Android、iPhone和iPad...
印度AI实验室发布30B和10... 2月20日,印度AI实验室Sarvam在印度人工智能影响力峰会上发布了两款新一代MoE架构大语言模型...
大湾鸡春节打卡热:3天客流破万... 南方财经记者谭砚文 广州报道“为了大湾鸡,动车往返8小时!”今年春节,福建厦门的王慧把目的地定在广州...
夫妻双双摘金!徐梦桃丈夫王心迪... 2026年米兰冬奥会自由式滑雪男子空中技巧决赛北京时间20日晚举行,中国选手王心迪夺得冠军!值得一提...
首届人机协同春晚,广东探索的人... 2026年春节联欢晚会仿佛具身机器人的“集体汇报演出”,向世界展示了中国科技创新与产业升级的丰硕成果...
在米兰,冰雪赛场藏着中国式浪漫 当中国风遇上冰雪赛场会产生哪些惊艳碰撞?一起来看米兰冬奥会上的中国元素↓谷爱凌身着“青花瓷”雪服亮相...
多视角解锁新春归途上科技“新”... 央视网消息:如今,乘坐高铁、开新能源汽车回家早已成为老百姓司空见惯的出行选择。但或许少有人留意,回家...
行稳致远开新局丨咖香漫路花盈途... 编者按:乘势而上,阔步向前。2026年是“十五五”开局之年,是全面建设社会主义现代化国家新征程的关键...