1月15日,阶跃星辰官方微信公众号宣布,其开源模型Step-Audio-R1.1在全球知名权威大模型评测榜单ArtificialAnalysisSpeechReasoning中登顶榜首,成为全球第一的原生语音推理模型。该榜单主要评估模型直接处理音频并进行复杂逻辑推理的能力,考察维度包括准确率、首包延迟等。Step-Audio-R1.1以96.4%的准确率超越Grok、Gemini、GPT-Realtime等主流一线模型,刷新历史最好成绩。
Step-Audio-R1.1是阶跃星辰发布的全球首个开源原生语音推理模型,具备深度语音推理实时响应能力和音频领域的可扩展CoT。作为最新升级版本,Step-Audio-R1.1兼顾更强实时对话和复杂语音推理能力。完整的实时语音API将在2月上线,目前开放的chat模式已搭载R1.1核心,支持边想边说的流式推理。Step-Audio-R1.1能在不增加额外时延的情况下,端到端理解语音内容,实现"像人类一样听到对话即可思考"。

