11月25日,OpenAI宣布将“语音模式”(VoiceMode)整合至ChatGPT的主聊天界面,这一更新使得用户能够在语音对话中实时查看地图、图片等视觉信息和文字转录,实现了多模态交互。此前,语音对话作为一个独立的功能模块存在,现在用户可以直接在主聊天窗口内启动语音交互,无需切换模式,提供了更无缝、更多功能的多模态体验。
新版语音模式的最大亮点在于其整合了视觉信息呈现能力。在用户通过语音提问时,ChatGPT不仅能用自然流畅的语音回答,还能在聊天界面中实时显示相关的视觉内容,例如地图、图表或图片。同时,系统会自动生成语音对话的文字转录稿,方便用户随时回顾和查阅交流内容。OpenAI在此次更新中也考虑到了不同用户的使用习惯,提供了一个切换开关,允许用户一键将界面恢复到旧版的独立语音模式。
OpenAI正持续推进战略布局,迭代产品、拓展AI应用边界。此前,该公司已推出了用于商品比价的AI购物助手、支持iCloud钥匙串的AtlasAI浏览器新功能、在部分地区上线的群聊功能,以及性能更强的GPT-5.1模型等。
