智通财经获悉,在首次公开演示将近七个月后,OpenAI正式面向广大付费用户推出ChatGPT类人高级人工智能(AI)语音助手的新功能,实时视频对话。在周四的直播中,该公司表示,ChatGPT类似人类的对话功能Advanced Voice Mode正在实现。Advanced Voice由OpenAI的多模态模型GPT-4o支持。
OpenAI宣布,在ChatGPT的移动端应用程序App中,上线ChatGPT高级语音模式Advanced Voice的视频和共享屏幕功能,即使用ChatGPT应用程序,订阅ChatGPT Plus、 Team或Pro的用户可以将他们的手机指向对象,并让ChatGPT近乎实时地响应。
OpenAI的研究员在直播中演示了任何运用新功能,点击ChatGPT 聊天栏旁边的语音图标,然后点击左下角的视频图标,就可以启动视频对话。如果想共享屏幕,手机用户要点击打开一个有三个喧嚣的菜单,选择其中的“共享屏幕”。Advanced Voice可以通过屏幕共享来理解设备屏幕上的内容。例如,它可以解释各种设置菜单,或者对数学问题给出建议。
OpenAI表示,大多数ChatGPT Plus和 Pro套餐的订阅用户以及所有Team用户都将可以在今后几天内通过ChatGPT的App访问周四推出的新功能,预计欧盟、瑞士、冰岛、挪威和列支敦士登的 ChatGPT Plus 和 Pro 用户也将很快可以运用新功能。ChatGPT的企业版和教育版Enterprise和Edu将于明年1月上线新功能。
Advanced Voice已经被推迟了好几次,据报道部分原因是OpenAI在产品准备就绪之前就宣布了这项功能。今年4月,OpenAI承诺,“Advanced Voice”将在“几周内”向用户推出。几个月后,该公司表示需要更多时间。
OpenAI在6月末向一小批Plus计划用户推出该语音模式,6月又宣布推迟一个月发布,以便确保该功能安全有效地处理来自数百万用户的请求。当时OpenAI称,计划今年秋季让所有Plus用户都可以访问该功能,确切的时间表取决于是否达到内部对安全性和可靠性的高标准。7月末,OpenAI对有限的部分付费Plus用户推出高级语音模式下的ChatGPT,称语音模式无法模仿他人的说话方式,且增加了新的过滤器,保证软件能够发现并拒绝某些生成音乐或其他形式受版权保护音频的请求。
此外,谷歌(GOOGL.US)和Meta(META.US)等竞争对手也在为各自的聊天机器人产品开发类似的功能。本周,谷歌推出了实时视频分析对话式人工智能功能Project Astra,供一群“值得信赖的测试者”使用。