OpenAI发力音频AI,语音交互设备明年亮相!
创始人
2026-01-02 00:08:03
0

1月1日,据The Information报道,OpenAI正在加强其音频人工智能能力,为未来推出一款以语音为核心的个人AI设备做准备。这款设备将以听觉交互为主要形式,不依赖屏幕。目前,ChatGPT的语音功能与文本回答使用的模型不同。OpenAI内部研究人员认为,现有音频模型在准确性和响应速度上明显落后,因此公司在过去两个月内集中力量攻克音频模型短板。这一调整旨在打造一款可通过自然语音指令操作的消费级设备。首款产品预计至少还需要一年时间才能面世。

随着新架构的引入,音频模型已能生成更自然、更富情感的语音回应,并具备与人类同时发声、应对打断的能力。OpenAI计划在2026年第一季度正式发布该模型。在硬件形态上,OpenAI与谷歌、亚马逊、Meta和苹果的判断相似,认为现有主流设备并非为未来的AI交互而生。OpenAI团队希望用户通过"说话"而非"看屏幕"与设备互动,认为语音才是最贴近人类交流本能的方式。与OpenAI合作推进硬件项目的乔尼・艾维也强调,无屏幕设计不仅更自然,还有助于避免用户沉迷。他认为,新一代设备应当纠正以往消费电子产品带来的负面影响,并为此承担责任。

不过,OpenAI目前仍面临现实挑战。内部人士指出,不少ChatGPT用户并未习惯使用语音功能,这种情况不仅因为音频模型效果不彰,也与功能认知不足有关。在推出音频优先的AI设备之前,OpenAI必须先改变用户的使用习惯。在组织层面,OpenAI已组建专门团队推进音频AI战略。来自Character.AI的语音研究员昆丹・库马尔负责整体方向,本・纽豪斯正在重构面向音频的底层架构,多模态ChatGPT的产品经理杰基・香农也参与其中。OpenAI并不打算只推出一款设备,而是规划了一条产品线,包括智能眼镜和无屏幕智能音箱。公司内部的设想是,这类设备将以"伴随式助手"的形态存在,主动理解环境和用户需求,并在获得授权的情况下,通过音频和视频持续提供帮助。为支撑这一长期布局,OpenAI已在2025年初斥资近65亿美元收购乔尼・艾维联合创办的io,并同步推进供应链、工业设计与模型研发等多条工作线。

相关内容

热门资讯

15万起!MG07轿跑新配色亮... 今日,上汽MG发布了MG07车型的新配色“莫雷洛紫”官图,预计新车将定位于15-20万元级市场,并计...
百度昆仑芯拟港交所科创板同步上... 5月8日,北京证监局信息公示显示,百度旗下芯片公司昆仑芯已与中国国际金融股份有限公司签署IPO辅导协...
保时捷Taycan Turbo... 5月8日,小米汽车CTO胡峥楠在微博上发文,向保时捷在赛道上取得的佳绩表示祝贺。胡峥楠提到,赛道上只...
乐道L80旗舰SUV下周上市,... 乐道L80将于下周正式上市,预售价格15.98万起。这款智能双舱大五座旗舰SUV,聚焦城市通勤、家庭...
甲骨文AI加速安全更新,5月2... 5月8日,甲骨文公司宣布将改变其传统的“按季度发布”安全更新模式,转而采用更快速的更新节奏。这一变化...
特斯拉霸榜前三!纯电车保值率大... 日前,中国汽车流通协会和精真估联合发布了《2026年4月中国汽车保值率研究报告》。报告显示,在纯电动...
上汽大众联手神州租车,首批多款... 5月8日,上汽大众与神州租车签署年度采购框架协议,并完成了首批车辆的交付。此次合作涉及的车型包括大众...
宝骏华境S震撼上市!14.98... 5月8日,上汽通用宝骏华境S正式上市,推出4款配置车型,限时置换价区间为14.98-19.38万元。...
华为技术加持!五菱华境S大六座... 今日,上汽通用五菱与华为合作的首款大六座SUV——华境S正式上市并立即交付。华境S集合了18家供应商...
2026款广汽丰田铂智3X上市... 今日,广汽丰田宣布2026款铂智3X正式上市,标志着地平线征程®6B芯片的全球首发量产。该车型入门版...