5月9日,阶跃星辰发布了新一代实时语音大模型StepAudio2.5Realtime,并已全面上线。该模型致力于提供更具“活人感”的AI对话体验,通过副语言感知、人设自定义与对话能力三个方向的技术升级。StepAudio2.5Realtime的核心优势在于其对副语言信息的处理能力,能够解读语调、语速、停顿等非文字表达方式,从而感知对话者的情绪状态与潜在意图,动态调整回应的语气与策略。
在人设灵活性方面,StepAudio2.5Realtime允许开发者通过API对AI角色进行精细化调节,包括性格特质、背景经历等。这一能力基于超过10,000个高质量原生人设,通过算法裂变生成的百万级人设特征矩阵,并结合海量真实场景对话语料训练而来。开发团队还针对深度角色扮演中的“人设崩塌”问题进行了专门的RLHF对齐优化,确保模型在极端情境下保持角色一致性。
StepAudio2.5Realtime在整体对话能力上强调智商与情商的双重提升,能够深度理解复杂语义、应对交流场景,并灵活调用多领域知识提供深度对话体验。官方发布的2026年4月评测数据显示,该模型在五个测试维度中均位列第一,主观评测得分80.41,语音问答基准得分79.80,约为GPT-Realtime-1.5的1.5倍。

