获悉,9月25日,OpenAI宣布面向其所有付费用户开放ChatGPT的类人高级人工智能(AI)语音助手功能——“高级语音模式”(AVM)。
高级语音新增自定义指令
据悉,AVM提高了部分外语的对话速度、流畅度并改进口音。语音方面,OpenAI推出了五种不同风格的新声音:Arbor、Maple、Sol、Spruce 和 Vale,加上之前老版本的四种声音Breeze、Juniper、Cove和Ember,可选声音达到九种。
这意味着,ChatGPT的Plus版个人用户和小型企业团队用户(Teams)可以通过“说话”的方式,而不是输入提示来使用聊天机器人。当用户在应用程序上进入语音模式时,他们会通过一个弹出窗口知道他们已经进入了高级语音助手。
5月,OpenAI首次展示了这款语音产品,并展示了它如何快速响应用户发出的书面和视觉提示。现在所有付费订阅ChatGPT Plus和Team计划的用户,都将可以使用新的AVM功能,不过该模式将在未来几天逐步推出。
眼下,随着科技的飞速发展,人工智能成为人们重要关注的热点,在众多人工智能技术中,AI大模型无疑成为了引领未来智能科技的璀璨明星。AI大模型作为一种具有极高智能和强大计算能力的技术,正改变着大众的生活、工作和思维方式,为人类社会带来前所未有的发展机遇。
关注相关公司
Snap(SNAP.US)
据了解,Snap与谷歌云扩大战略合作伙伴关系,为其社交媒体平台Snapchat的人工智能聊天机器人提供动力。Snapchat的My AI聊天机器人将利用谷歌在Vertex AI上的Gemini技术,特别是该技术在文本、音频、图像、视频和代码等不同类型信息上的理解和操作能力。
今年早些时候,Snap开始使用Gemini的多模式生成人工智能功能。Snap表示,这一转变使My AI在美国的用户参与度提高了2.5倍以上。谷歌云首席执行官表示:“Snap是帮助人们在数字世界中交流的早期领导者,现在它站在了使用生成式人工智能构建代理的最前沿,为其社区创造新价值。”
苹果(AAPL.US)
9月24日消息,苹果正继续在开发者测试版中推进Apple Intelligence技术,推出了iOS 18.1、iPadOS 18.1和macOS Sequoia 15.1的第五个开发者测试版,同时发布了visionOS 2.1、tvOS 18.1和watchOS 11.1的第二个测试版本。
据悉,Apple Intelligence是iOS 18.1与18.0之间最大的区别。这项新技术整合了生成式AI和机器学习功能,进一步优化AI功能。虽然并非所有的Apple Intelligence功能都会在正式版本发布时全面上线,但已经有一些早期功能出现在测试版中。
英伟达(NVDA.US)
据悉,面临市场与政策挑战,英伟达将发布最新产品和技术动态,或推5090显卡成科技亮点。近期,黄仁勋作为英伟达的首席执行官,提出了英伟达在人工智能、深度学习和图形处理方面的最新进展,展示了公司在这些领域的技术积累和市场领导地位。
对于英伟达5090显卡的传闻,业内分析人士表示,如果英伟达继续保持以往的产品更新节奏,5090显卡在2025年问世的可能性是相当高的。随着图形处理需求的不断增加,特别是在游戏、虚拟现实和人工智能训练等领域,英伟达不断推陈出新以满足市场的期望。
此外,黄仁勋强调英伟达在量子计算和边缘计算等新兴领域的布局,随着技术的发展,这些领域逐渐成为驱动未来计算能力的关键。分析师认为,英伟达不仅会在显卡领域继续创新,还将通过收购和合作来扩展其技术生态。
阿里巴巴(BABA.US)
自2023年提出“AI驱动”战略以来,阿里巴巴通过大力投资AI基建,以及在B端和C端用户侧快速推进AI应用,实现了从云计算、核心电商到全球业务拓展的全方位变革。
阿里巴巴在技术研发和客户服务上的持续投资,长期为后续的技术创新奠定坚实基础,进一步增强了公司在全球市场中的竞争力。阿里称,持续通过低成本试用推动新用户尝试云环境、云技术和云业务,为未来博取广阔增长前景。
微美全息(WIMI.US)
资料显示,微美全息是一家专注于AR+AI高新技术研发企业,在AI方面的突出能力禀赋中。该公司在多个场合展示其创新的多领域人工智能解决方案,尤其在教育、康养、政务、文旅、直播、传媒等多个行业开展深度应用,取得了显著成效。这不仅彰显了其在行业大模型领域的深度布局和广泛应用,也印证了其在该领域的领先地位。
另外,当前,大模型密集诞生竞争激烈,这一现实也毋庸置疑将为微美全息带来更广泛的云AI计算需求和全新增长机遇。基于AI技术能力的突破、AI运算需求的提升,可增强其他生成模型的视频表现,对生成视频的显著改进,对于追求高质量内容输出的创作者来说,则是不可忽略的显性优势,未来,这将为微美全息的业务带来互相共振的双重利好。
字节跳动
目前,国内AI头部互联网大厂纷纷发力据报道,字节跳动正式宣告进军AI视频生成。9月24日,字节跳动一举发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。
据介绍,无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到业界先进水平,可应用在电商营销、动画教育、城市文旅、微剧本等领域。豆包大模型发布以来使用量爆发式增长。
结尾
随着科技的不断进步,AI领域正迎来前所未有的发展机遇。分析人士认为,这一轮技术迭代,或将使AI行业诞生新的一线梯队,无疑将为整个行业带来新的活力和创新,特别在应用场景上,AI落地商用将进一步明朗。
高级语音新增自定义指令
据悉,AVM提高了部分外语的对话速度、流畅度并改进口音。语音方面,OpenAI推出了五种不同风格的新声音:Arbor、Maple、Sol、Spruce 和 Vale,加上之前老版本的四种声音Breeze、Juniper、Cove和Ember,可选声音达到九种。
这意味着,ChatGPT的Plus版个人用户和小型企业团队用户(Teams)可以通过“说话”的方式,而不是输入提示来使用聊天机器人。当用户在应用程序上进入语音模式时,他们会通过一个弹出窗口知道他们已经进入了高级语音助手。
5月,OpenAI首次展示了这款语音产品,并展示了它如何快速响应用户发出的书面和视觉提示。现在所有付费订阅ChatGPT Plus和Team计划的用户,都将可以使用新的AVM功能,不过该模式将在未来几天逐步推出。
眼下,随着科技的飞速发展,人工智能成为人们重要关注的热点,在众多人工智能技术中,AI大模型无疑成为了引领未来智能科技的璀璨明星。AI大模型作为一种具有极高智能和强大计算能力的技术,正改变着大众的生活、工作和思维方式,为人类社会带来前所未有的发展机遇。
关注相关公司
Snap(SNAP.US)
据了解,Snap与谷歌云扩大战略合作伙伴关系,为其社交媒体平台Snapchat的人工智能聊天机器人提供动力。Snapchat的My AI聊天机器人将利用谷歌在Vertex AI上的Gemini技术,特别是该技术在文本、音频、图像、视频和代码等不同类型信息上的理解和操作能力。
今年早些时候,Snap开始使用Gemini的多模式生成人工智能功能。Snap表示,这一转变使My AI在美国的用户参与度提高了2.5倍以上。谷歌云首席执行官表示:“Snap是帮助人们在数字世界中交流的早期领导者,现在它站在了使用生成式人工智能构建代理的最前沿,为其社区创造新价值。”
苹果(AAPL.US)
9月24日消息,苹果正继续在开发者测试版中推进Apple Intelligence技术,推出了iOS 18.1、iPadOS 18.1和macOS Sequoia 15.1的第五个开发者测试版,同时发布了visionOS 2.1、tvOS 18.1和watchOS 11.1的第二个测试版本。
据悉,Apple Intelligence是iOS 18.1与18.0之间最大的区别。这项新技术整合了生成式AI和机器学习功能,进一步优化AI功能。虽然并非所有的Apple Intelligence功能都会在正式版本发布时全面上线,但已经有一些早期功能出现在测试版中。
英伟达(NVDA.US)
据悉,面临市场与政策挑战,英伟达将发布最新产品和技术动态,或推5090显卡成科技亮点。近期,黄仁勋作为英伟达的首席执行官,提出了英伟达在人工智能、深度学习和图形处理方面的最新进展,展示了公司在这些领域的技术积累和市场领导地位。
对于英伟达5090显卡的传闻,业内分析人士表示,如果英伟达继续保持以往的产品更新节奏,5090显卡在2025年问世的可能性是相当高的。随着图形处理需求的不断增加,特别是在游戏、虚拟现实和人工智能训练等领域,英伟达不断推陈出新以满足市场的期望。
此外,黄仁勋强调英伟达在量子计算和边缘计算等新兴领域的布局,随着技术的发展,这些领域逐渐成为驱动未来计算能力的关键。分析师认为,英伟达不仅会在显卡领域继续创新,还将通过收购和合作来扩展其技术生态。
阿里巴巴(BABA.US)
自2023年提出“AI驱动”战略以来,阿里巴巴通过大力投资AI基建,以及在B端和C端用户侧快速推进AI应用,实现了从云计算、核心电商到全球业务拓展的全方位变革。
阿里巴巴在技术研发和客户服务上的持续投资,长期为后续的技术创新奠定坚实基础,进一步增强了公司在全球市场中的竞争力。阿里称,持续通过低成本试用推动新用户尝试云环境、云技术和云业务,为未来博取广阔增长前景。
微美全息(WIMI.US)
资料显示,微美全息是一家专注于AR+AI高新技术研发企业,在AI方面的突出能力禀赋中。该公司在多个场合展示其创新的多领域人工智能解决方案,尤其在教育、康养、政务、文旅、直播、传媒等多个行业开展深度应用,取得了显著成效。这不仅彰显了其在行业大模型领域的深度布局和广泛应用,也印证了其在该领域的领先地位。
另外,当前,大模型密集诞生竞争激烈,这一现实也毋庸置疑将为微美全息带来更广泛的云AI计算需求和全新增长机遇。基于AI技术能力的突破、AI运算需求的提升,可增强其他生成模型的视频表现,对生成视频的显著改进,对于追求高质量内容输出的创作者来说,则是不可忽略的显性优势,未来,这将为微美全息的业务带来互相共振的双重利好。
字节跳动
目前,国内AI头部互联网大厂纷纷发力据报道,字节跳动正式宣告进军AI视频生成。9月24日,字节跳动一举发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。
据介绍,无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到业界先进水平,可应用在电商营销、动画教育、城市文旅、微剧本等领域。豆包大模型发布以来使用量爆发式增长。
结尾
随着科技的不断进步,AI领域正迎来前所未有的发展机遇。分析人士认为,这一轮技术迭代,或将使AI行业诞生新的一线梯队,无疑将为整个行业带来新的活力和创新,特别在应用场景上,AI落地商用将进一步明朗。