美团发布685亿参数轻量化AI模型,长文档处理新突破!
创始人
2026-02-06 16:32:44
0

今日,美团发布了一款名为LongCat-Flash-Lite的轻量化MoE模型,该模型拥有685亿参数,每次推理仅激活29亿至45亿参数。LongCat-Flash-Lite通过将超过300亿参数用于嵌入层,宣称在智能体与代码领域表现突出,并依托YARN技术可支持最长256K上下文,能高效处理长文档、大规模代码分析等场景。

LongCat-Flash-Lite模型基于嵌入扩展的应用与系统级优化,大幅提升了模型推理效率。在输入4K,输出1k的典型负载下,LongCatAPI可提供500-700token/s的生成速度。美团宣布向开发者开放LongCat-Flash-Lite版本API接口,开发者可登录LongCatAPI开放平台申请,每日免费额度为5000万tokens。

相关内容

热门资讯

华为乾崑助力广汽启境轿跑,三电... 今日,华为乾崑与广汽联合打造的启境首款猎装轿跑在冬季测试期间,启境汽车CEO刘嘉铭和华为智能汽车解决...
阿里千问App春节免单活动9小... 2月6日,阿里巴巴旗下的千问App宣布,其“春节30亿大免单”活动自上线9小时后,订单量已突破100...
一汽奔腾焕新战略,全新旗舰悦意... 昨日,在2026年一汽奔腾全球生态伙伴大会上,一汽奔腾宣布了双擎全球战略,标志着品牌全面战略焕新与系...
比亚迪腾势Z9GT官图曝光:新... 2月6日,比亚迪腾势汽车官方发布了全新腾势Z9GT的官图。新车在外观上进行了升级,新增了“峡湾绿”外...
男子刚退休就瘫痪,小23岁女友... 最近,家住上海宝山区高境镇的徐先生向记者求助。他表示,从去年10月起就没有睡过一个整觉,原就是一墙之...
广湛高铁新站迎春运“大考”:2... 2026年2月2日,为期40天的春运正式启动,连日来,广湛高铁沿线湛江北、阳江北、茂名南等新开通站点...
“万象新生·共创精彩”,羊晚集... 做精传统媒体、做强移动媒体,是羊城晚报报业集团系统性变革的主要任务。媒体的做精做强,离不开优秀内容的...
国际观察:移民执法风暴揭露美国... 近期,美国移民与海关执法局(ICE)特工在明尼苏达州枪杀两名美国公民,引发美国国内大规模抗议甚至暴力...
全球媒体聚焦︱外媒:美国就业市... 美国劳工统计局当地时间5日公布的数据显示,美国当前市场上的职位空缺数量降至2020年以来的最低水平。...
大状王首登广州!“湾区有戏”新... 2月5日,“湾区有戏”2026新年戏剧盛会媒体见面会在广东粤剧艺术中心粤书吧召开。记者在见面会上获悉...