1月29日,MiniMax稀宇科技发布了MiniMaxMusic2.5模型,宣称在段落级强控制和物理级高保真两大技术难题上实现突破。该模型开放全段落标签控制,支持14种结构变体,能够承载高复杂度音乐创作。用户可以在创作之初设计好整首歌的情绪曲线、高潮位置、乐器配置等,而不是生成后再碰运气。
MiniMaxMusic2.5通过对人声生成、风格建模、混音处理的系统性优化,让AI音乐在听感上达到专业制作水准。该模型针对华语流行音乐进行深度优化,覆盖各类场景,在可听性与传播性上实现系统级提升。通过优化人声合成,实现了连续细腻的转音、自然起伏的颤音,以及胸腔与头腔共鸣的灵活切换,声音表现力显著增强。
此外,MiniMaxMusic2.5扩充音色库至100+种乐器,并优化了混音处理,能够保持人声与伴奏的清晰分离,解决了AI音乐中常见的声音混叠问题。即使在乐器密集场景下也能保持各声部清晰。该模型深度适配专业工作流,在影视配乐、游戏动态声场、录音室级流行工业成品等场景下,均能胜任专业交付标准。

