据消息,在首次公开展示过去近10个月后,OpenAI日前终于宣布正式向用户开放AI视频生成模型Sora,并发布新的高端加速版本Sora Turbo。
开放AI视频生成模型Sora
Sora分辨率最高支持1080p,生成视频最长20秒,有三种常见画面比例供用户选择。在文图生成视频的基础功能之外,此次Sora全面升级交互页面,新增storyboard等功能,进一步提高用户体验和视频质量。
OpenAI 的掌舵人 Sam Altman 地宣布:"Sora 的推出不仅是一次技术突破,更是人工智能通往 AGI 的关键里程碑。" 他进一步强调,这一突破性进展标志着 OpenAI 在通用人工智能探索上又迈出了历史性的一步,将彻底重塑人类与视觉创作的关系。
业内专家纷纷表示,Sora 的横空出世犹如一记惊雷,不仅让竞争对手措手不及,更是让整个创意产业为之震动。这款堪称 " 视频界 GPT" 的革命性工具,展现出了 OpenAI 在 AI 领域的绝对统治力,也预示着一个全新的视觉创作时代即将来临。
相关全球企业积极布局
Sora引发了全球科技产业的震动,尤其是在视频生成领域。而面对Sora的冲击,全球企业加速布局AI视频生成领域,全力加紧文生视频大模型的研发。
Adobe(ADBE.US)
据悉,Adobe长期以来在图像处理、视频编辑软件等领域占据领先地位,而OpenAI此次发布的Sora技术,将视频生成的门槛大大降低。
实际上,Adobe公司发布了一项革命性的新技术——VideoGigaGAN,这是一项基于人工智能的视频超分辨率技术,据称能够将视频清晰度提高八倍。这一创新功能的推出,再次彰显了Adobe在数字媒体处理领域的领先地位。
据Adobe介绍,该技术不仅提升了视频的清晰度,还丰富了细节表现,这是许多其他系统难以同时实现的。例如,在增强的皮肤纹理、细毛以及天鹅羽毛等细节上,VideoGigaGAN表现出了惊人的能力。
谷歌(GOOG.US)
而就在Sora正式向用户开放的几天前,当地时间12月4日,谷歌旗下人工智能研究机构DeepMind Technologies Limited发布了一款名为Genie2的新型模型,可通过单张图片和文字描述生成“无限”种类的可玩3D世界。
微软(MSFT.US)
伴随着人工智能的发展,入局AI赛道的不在少数。早在2009年,微软就开始开发用于语音识别和文本生成的AI模型。
今年3月,微软宣布向Inflection AI支付6.5亿美元,以获得其AI软件的授权;同时,微软甚至为其组建了一个全新的部门——Microsoft AI,负责Copilot和其他消费者AI产品。
在模型之上,微软也广泛投资AI应用,涉及AI Agent(Adept AI)、低代码/无代码应用开发(Builder.ai)、机器人(Figure Robotics)、A
I内容创作(Typeface)、AI角色创作(Inworld AI)等热门方向。
腾讯(TCEHY.US)
近期,腾讯混元大模型公布最新进展,正式上线视频生成能力,这是继文生文、文生图、3D生成之后的又一里程碑。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的视频开源模型。
自年初以来,腾讯混元系列模型的开源速度不断加快。腾讯混元相关负责人透露,目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度,用户可在AI应用中的“AI视频”板块申请试用。此外,企业客户通过腾讯云提供服务接入,目前API同步开放内测申请。
微美全息(WIMI.US)
据了解,上市公司微美全息也纷纷拥抱AIGC,对AI视频生成技术十分重视,为主营业务赋能。当前,微美全息在文生视频算法领域,也取得了显著进展,全新迭代的AI视频模型在文生视频性能上实现了进一步提升,支持10秒时长及4K、60帧超高清画质,并自带音效和更好的人机交互及物理世界模拟。
此外,微美全息致力推动多模态大模型创新,以前所未有的速度进行迭代和创新,无论是文生视频,还是图生视频、视频生视频,AI 驱动的视频生成工具的使用不断增加,将有助于增强多模态AI视频制作工作流程,可以为影视、游戏、教育、营销、广告、社交媒体等领域发展提供更多增长空间。
结尾
可以说,由于Sora具有高度的创新性和广泛的应用潜力,它的推出有望加速AI在视频生成领域的商业化进程,预计后续AI领域商业化空间将打开。而视频生成大模型拥有乐观的商业化前景的同时,从近期实践来看,AI手机、AI PC等智能终端逐步走进日常生活,行业大模型在金融、工业、医疗等领域加快落地,借助大模型解决生产实际问题逐步形成共识。
开放AI视频生成模型Sora
Sora分辨率最高支持1080p,生成视频最长20秒,有三种常见画面比例供用户选择。在文图生成视频的基础功能之外,此次Sora全面升级交互页面,新增storyboard等功能,进一步提高用户体验和视频质量。
OpenAI 的掌舵人 Sam Altman 地宣布:"Sora 的推出不仅是一次技术突破,更是人工智能通往 AGI 的关键里程碑。" 他进一步强调,这一突破性进展标志着 OpenAI 在通用人工智能探索上又迈出了历史性的一步,将彻底重塑人类与视觉创作的关系。
业内专家纷纷表示,Sora 的横空出世犹如一记惊雷,不仅让竞争对手措手不及,更是让整个创意产业为之震动。这款堪称 " 视频界 GPT" 的革命性工具,展现出了 OpenAI 在 AI 领域的绝对统治力,也预示着一个全新的视觉创作时代即将来临。
相关全球企业积极布局
Sora引发了全球科技产业的震动,尤其是在视频生成领域。而面对Sora的冲击,全球企业加速布局AI视频生成领域,全力加紧文生视频大模型的研发。
Adobe(ADBE.US)
据悉,Adobe长期以来在图像处理、视频编辑软件等领域占据领先地位,而OpenAI此次发布的Sora技术,将视频生成的门槛大大降低。
实际上,Adobe公司发布了一项革命性的新技术——VideoGigaGAN,这是一项基于人工智能的视频超分辨率技术,据称能够将视频清晰度提高八倍。这一创新功能的推出,再次彰显了Adobe在数字媒体处理领域的领先地位。
据Adobe介绍,该技术不仅提升了视频的清晰度,还丰富了细节表现,这是许多其他系统难以同时实现的。例如,在增强的皮肤纹理、细毛以及天鹅羽毛等细节上,VideoGigaGAN表现出了惊人的能力。
谷歌(GOOG.US)
而就在Sora正式向用户开放的几天前,当地时间12月4日,谷歌旗下人工智能研究机构DeepMind Technologies Limited发布了一款名为Genie2的新型模型,可通过单张图片和文字描述生成“无限”种类的可玩3D世界。
微软(MSFT.US)
伴随着人工智能的发展,入局AI赛道的不在少数。早在2009年,微软就开始开发用于语音识别和文本生成的AI模型。
今年3月,微软宣布向Inflection AI支付6.5亿美元,以获得其AI软件的授权;同时,微软甚至为其组建了一个全新的部门——Microsoft AI,负责Copilot和其他消费者AI产品。
在模型之上,微软也广泛投资AI应用,涉及AI Agent(Adept AI)、低代码/无代码应用开发(Builder.ai)、机器人(Figure Robotics)、A
I内容创作(Typeface)、AI角色创作(Inworld AI)等热门方向。
腾讯(TCEHY.US)
近期,腾讯混元大模型公布最新进展,正式上线视频生成能力,这是继文生文、文生图、3D生成之后的又一里程碑。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的视频开源模型。
自年初以来,腾讯混元系列模型的开源速度不断加快。腾讯混元相关负责人透露,目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度,用户可在AI应用中的“AI视频”板块申请试用。此外,企业客户通过腾讯云提供服务接入,目前API同步开放内测申请。
微美全息(WIMI.US)
据了解,上市公司微美全息也纷纷拥抱AIGC,对AI视频生成技术十分重视,为主营业务赋能。当前,微美全息在文生视频算法领域,也取得了显著进展,全新迭代的AI视频模型在文生视频性能上实现了进一步提升,支持10秒时长及4K、60帧超高清画质,并自带音效和更好的人机交互及物理世界模拟。
此外,微美全息致力推动多模态大模型创新,以前所未有的速度进行迭代和创新,无论是文生视频,还是图生视频、视频生视频,AI 驱动的视频生成工具的使用不断增加,将有助于增强多模态AI视频制作工作流程,可以为影视、游戏、教育、营销、广告、社交媒体等领域发展提供更多增长空间。
结尾
可以说,由于Sora具有高度的创新性和广泛的应用潜力,它的推出有望加速AI在视频生成领域的商业化进程,预计后续AI领域商业化空间将打开。而视频生成大模型拥有乐观的商业化前景的同时,从近期实践来看,AI手机、AI PC等智能终端逐步走进日常生活,行业大模型在金融、工业、医疗等领域加快落地,借助大模型解决生产实际问题逐步形成共识。