今日,腾讯混元宣布开源翻译模型1.5版本,推出两个模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B,支持33个语种互译及5种民汉/方言。这两个模型已在腾讯混元官网上线,并可在Github和Huggingface等开源社区直接下载使用。HY-MT1.5-1.8B模型专为手机等消费级设备设计,经过量化处理,支持端侧直接部署和离线实时翻译,仅需1GB内存即可运行,且在参数量极小的前提下,效果超过大部分商用翻译API。HY-MT1.5-7B模型效果相比前一版本有较大提升,是WMT25比赛30个语种翻译冠军模型的升级版,重点提升了翻译准确率,大幅减少了译文中夹带注释和语种混杂的情况。
混元翻译1.8B和7B两个尺寸模型可同时使用,实现端侧和云侧模型的协同部署,提升模型效果的一致性和稳定性。在中外互译和英外互译测试集Flores200、WMT25以及民汉语言的测试集中,Tencent-HY-MT1.5-1.8B全面超越中等尺寸开源模型和主流商用翻译API,达到超大尺寸闭源模型的90分位水平。两个模型均实现了对术语库、长对话、带格式文本的翻译支持,更加全面。


