11月25日消息,阿里巴巴集团旗下的阿里云昨日宣布将为新加坡国家人工智能计划(AISingapore,简称AISG)的最新版本“Sea-Lion”大语言模型(LLM)——Qwen-Sea-Lion-v4提供技术支持。AISG此次放弃了Meta模型,转而采用阿里巴巴的通义千问Qwen开源架构。阿里云表示,Qwen-Sea-Lion-v4基于其Qwen3-32B基础模型构建。
阿里云为Qwen-Sea-Lion-v4的“高级后训练阶段”提供技术支撑,Qwen3-32B基础模型已额外接受了超过1000亿个东南亚语种词元的训练,显著提升了对本地表达方式、对话细微差别及区域性知识领域的理解能力。Qwen3基础模型本身已在涵盖119种语言与方言的规模庞大、高度多元的数据集上完成预训练,总训练数据量达36万亿词元,尤其强化了对东南亚语言的支持。AISingapore贡献了其开源的区域性数据集,包括面向东南亚语言任务的数据整理、优化与评估工作。Qwen-Sea-Lion-v4在参数规模低于2000亿的开源大模型中,位居“东南亚语言模型综合评估排行榜”首位,并已在AISingapore官网及HuggingFace平台开放免费下载。
