美团开源数字人视频生成技术,LongCat-Video-Avatar1.5升级亮相
创始人
2026-05-22 15:28:53
0

5月22日,美团技术团队宣布开源其数字人视频生成模型LongCat-Video-Avatar1.5。该版本在唇形同步、物理合理性、长视频稳定性、多人互动及推理效率等方面进行了升级,旨在推动数字人视频生成技术从高拟真走向真可用的商业化场景。LongCat-Video-Avatar1.5在1.0版本基础上全面升级,从开源SOTA走向商业级应用,强化了基础体验,能够应对复杂语音输入,使唇部运动更精准平滑,同时面部表情、头部姿态与肢体动作也更为协调。

LongCat-Video-Avatar1.5在场景支持方面,借助高质量数据体系,模型可稳定处理真人、动漫、动物等多种主体,并在多人对话场景中自然区分说话者与聆听者。推理部署方面,采用DMD蒸馏技术,将生成步数从50步压缩至8步,推理效率提升约15倍,生成一段10秒视频仅需约1分钟。技术架构上,1.5版本主要在基础体验商用化、数据处理流程优化和手部稳定性动作连续性优化三方面实现升级。

相关内容

热门资讯

“千问App升级!Qwen3.... 5月22日,千问App官方公众号宣布,千问App、PC端及网页端已接入全新一代大模型Qwen3.7-...
中国电动车欧洲销量飙升,全球市... 5月22日,中国品牌在欧洲电动车市场的销量占比首次突破15%,创下历史新高。4月份,比亚迪、奇瑞等国...
岚图泰山X8挑战极限:2.79... 今日,岚图汽车在上市发布会上展示了岚图泰山X8飞崖20m挑战的实测视频。视频中,重达2.79吨的新车...
北京亦庄人形机器人马拉松:速度... 5月22日,国家发展改革委在新闻发布会上透露,北京亦庄人形机器人半程马拉松比赛今年呈现出显著进步。国...
5月新能源车市回暖,零售量环比... 今日,乘联分会发布最新调研报告,5月狭义乘用车零售市场规模预计约为152万辆,环比增长9.9%。其中...
指引发布:人工智能应用伦理安全... 5月19日,2026年中国网络文明大会人工智能赋能网络文明建设分论坛上,全国网络安全标准化技术委员会...
文脉如何传?创新怎么干?202... 5月21日,2026文化强国建设高峰论坛在深圳开幕。本届论坛围绕“文脉文运的传承与文化的创新创造”主...
全民参与+党员干部带头,广州将... 记者5月22日从广州市城市管理和综合执法局获悉,广州市委组织部、市委宣传部、市委社会工作部、市直机关...
“来南沙 创未来”全球邀约发出... 5月21日,第三十四届广州国际旅游展览会在广交会展馆开幕,广州南沙首次以独立展区亮相,并举办“来南沙...
比亚迪5月28日智能化战略发布... 5月22日,比亚迪宣布将于5月28日召开智能化战略发布会,预计将宣布在智能化技术方面的新突破。此前在...