阿里通义发布新一代语音交互模型Fun-Audio-Chat8B,性能领先业界
创始人
2025-12-23 18:35:57
0

今日,阿里巴巴集团旗下的阿里通义大模型发布了新一代端到端语音交互模型Fun-Audio-Chat。该模型以其在多个语音交互榜单上的卓越表现而备受关注,尤其是在OpenAudioBench、MMAU、Speech-ACEBench、VStyle等榜单上,Fun-Audio-Chat8B模型在同尺寸模型中排名第一,综合性能超越了GLM4-Voice、Kimi-Audio、Baichuan-Omni等竞争对手。

Fun-Audio-Chat的技术亮点包括端到端S2S架构,该架构允许模型直接从语音输入生成语音输出,无需复杂的ASR+LLM+TTS多模块拼接,从而提高了效率并降低了延迟。此外,模型采用了双分辨率设计,SharedLLM层以5Hz帧率处理,而SRH以25Hz帧率生成高质量语音,显著降低了GPU的计算开销。Fun-Audio-Chat还经过了百万小时多任务数据的训练,覆盖了音频理解、语音问答、情感识别、工具调用等多种真实场景,使模型更加贴近实际应用。

阿里通义强调,Fun-Audio-Chat能够提供类似朋友间的对话体验,能够感知用户情绪,甚至在用户没有直接表达情绪时,也能从语气、语速、停顿中推断出用户的心情,并给出相应的回应。同时,该模型能够完成复杂任务,用户只需用自然语音下达指令,Fun-Audio-Chat便能自动调用相应函数。

相关内容

热门资讯

智界V9旗舰MPV首发头套式安... 今日,博主@嗨大星_ECC分享了智界V9旗舰MPV的更多细节,新车有望行业首发“头套式安全气囊”(H...
美国FCC将大疆无人机列入管制... 当地时间12月22日,美国联邦通信委员会(FCC)发布情况说明,明确指出外国制造的无人机及其关键部件...
宁德时代骐骥换电干线川渝鄂段通... 12月23日,宁德时代在重庆巫山举行了骐骥换电沪蓉干线川渝鄂段通车活动,标志着这条物流主干线正式迈入...
吉利星愿销量破50万,智能座舱... 12月23日,吉利汽车宣布,其旗下爆款车型吉利星愿累计交付量已突破50万辆。自2024年10月上市以...
“执法+劝导+科技+宣传”齐发... 近年来,广州市番禺区电动自行车保有量持续攀升。为守护群众出行安全,进一步规范电动自行车通行秩序,番禺...
广东电竞新纪元:首届“电竞粤超... 为贯彻落实《关于推动广东电子竞技产业高质量发展的若干政策措施》,在中共广东省委宣传部、广东省文化和旅...
以下是一些改写“回应民生关切”... 回应民生关切是政府工作的重要使命。通过加强政策调研,精准把握民众需求,制定切实可行的举措。在教育方面...
魏牌9年换8帅,长城汽车董事长... 12月21日,长城汽车旗下魏牌宣布赵永坡成为新任CEO,这是该品牌成立9年来的第8次CEO更迭。赵永...
小鹏X9纯电版升级:续航突破7... 近日,新款小鹏X9纯电版车型的申报图及相关信息曝光。该车型将配备中创新航的三元锂电池,提供710km...
好评中国丨“情绪经济”焕新,为... 编者按:韧性,是读懂2025年中国经济的关键词。 宏观承压之下,一系列“新消费”现象展现出澎湃的内需...