美团发布开源虚拟人视频生成模型,实现情感表达新突破
创始人
2025-12-18 18:23:59
0

12月18日,美团LongCat团队宣布正式发布并开源SOTA级虚拟人视频生成模型——LongCat-Video-Avatar。该模型基于LongCat-Video基座打造,延续“一个模型支持多任务”的核心设计,原生支持Audio-Text-to-Video、Audio-Text-Image-to-Video及视频续写等核心功能。

LongCat-Video-Avatar在底层架构上全面升级,实现动作拟真度、长视频稳定性与身份一致性三大维度的突破。模型不仅能指挥嘴型,还能同步指挥眼神、表情和肢体动作,实现丰富饱满的情感表达。美团通过DisentangledUnconditionalGuidance训练方法,让模型在说话间歇也能自然地眨眼、调整坐姿、放松肩膀,使虚拟人更像真人。

LongCat-Video-Avatar成为首个同时支持文字、图片、视频三种生成模式的“全能选手”,在HDTF、CelebV-HQ、EMTD和EvalTalker等权威公开数据集上的定量评测表明,该模型在多项核心指标上达到SOTA领先水平。

相关内容

热门资讯

吉利汽车拟购福特西班牙产线 欧... 近日,西班牙行业媒体《LaTribunadeAutomoción》报道称,吉利汽车(00175.HK...
大众ID.ERA系列首款轿车亮... 5月9日,工信部发布了第407批《道路机动车辆生产企业及产品公告》新产品公示,其中上汽大众ID.ER...
华为技术加持!东风奕派M8大六... 今日,东风奕派发布了奕派M8的最新预告图,这款大六座SUV搭载了华为乾崑技术,预计将于本月亮相。奕派...
星火成炬 沃野新篇|路虽遥 行... 当一条条路如大地的脉络联通人间烟火,也如一把把利剑斩断深山阻隔,乡愁有了安稳归途,乡土有了振兴出路。
粤超草根球员群像:五金店老板、... “当茂名进球后,屏幕上出现队标,还写着‘入波嗲’,又开心又感动!”5月3日,粤超茂名队主场迎战湛江队...
南方日报评论员:以“五大行动”... 文丨南方日报评论员“百县千镇万村高质量发展工程”是广东破解城乡区域发展不平衡难题的关键抓手,在全省发...
香港海关侦破两宗毒品案件,查获... 文、图/羊城晚报全媒体记者 鄢敏5月8日晚,香港特区政府新闻网公布侦破两宗毒品案件相关情况。据新闻公...
【图解】“五一”遇春假,全场景... 内容来源:经济日报文案/设计:景远策划:刘江校对:石兰审核:张厚为
人民论坛网评 | 从群众视角看... 习近平总书记强调,“为民造福是最大政绩”“业绩好不好,要看群众实际感受,由群众来评判”。政绩不是干部...
全国防灾减灾周将至,广东省地震... 记者5月7日从广东省地震局获悉,在即将到来的全国防灾减灾周,位于广州市越秀区先烈中路81号大院广东省...