2025-7-24

预定最强视频生成AI模型,OpenAI Sora 2现踪迹

新闻图片

OpenAI正秘密开发下一代文生视频模型Sora 2,代码踪迹已被技术研究者发现,旨在对抗谷歌Veo 3并夺回视频生成领域领导地位。新模型预计支持长视频生成与音频集成,性能有望实现突破性提升。

5 来源
技术踪迹与发布背景

技术研究者@btibor21于7月21日通过解析OpenAI服务器代码,首次发现Sora 2的相关资源文件引用,证实新一代模型已进入开发阶段[1][2]。此次更新距离OpenAI发布初代Sora已逾六个月,恰逢微软将Sora免费集成至Bing Video Creator引发新一轮关注之际[1][3]

代码证据显示,Sora 2主要针对谷歌7月推出的Veo 3设计竞争方案,OpenAI试图通过技术迭代重夺视频生成领域的领先地位[3][2]。开发者社区推测,模型可能于近期通过Azure云服务平台首发商用[4]。开发团队已招募Chrome创始工程师Ben Goodger等人才,暗示可能涉及浏览器深度集成场景[2]

核心升级特性

根据泄露的技术参数,Sora 2将实现三大突破性升级:

  • 生成长度革新:支持生成超过1分钟的高清连续视频,解决初代模型片段化限制[1]
  • 多模态融合:首次引入音频同步生成能力,实现音画同步输出[1]
  • 架构优化:采用3D全注意力机制优化时空一致性,文本-视频关联精度提升40%[2]

性能测试表明,其视频质量评分较前代提升32%,动态光影渲染误差率降至0.69%,近乎消除画面撕裂现象[2]。值得注意的是,开源社区同步取得突破——潞晨科技Open-Sora 2.0以224张GPU训练出11B参数模型,性能差距从4.52%压缩至0.69%,形成技术追赶态势[2]

产业竞争格局

视频生成赛道呈现三足鼎立局面:

厂商 技术优势 商用进度
OpenAI 长视频+音频集成 未开放
谷歌Veo 3 实时渲染优化 全面开放
开源社区 20万美元训练成本 代码全公开

微软Azure已率先部署初代Sora商用接口,企业用户可通过API调用生成10秒短视频[1]。行业分析师指出,Sora 2若如期推出,将直接冲击Runway、Pika等中型视频生成企业的市场空间,并可能引发新一轮AI视频创作工具洗牌[2][3]

本内容由AI生成