Newsroom
AIEII

AI 周刊 #9:Sora 2.0 让视频生成进入新纪元

Sora 2.0 发布引爆视频创作圈,Udio 获得大额融资,多模态模型竞赛白热化。

2026年02月22日

AI 周刊 #9:Sora 2.0 让视频生成进入新纪元

本周的主角毫无疑问是 Sora 2.0。OpenAI 在去年底发布 Sora 1.0 时曾让整个创意行业倒吸一口凉气,而 2.0 版本则让那口气彻底咽了下去。


Sora 2.0:不只是更长、更清晰

让我们先看硬参数:

指标Sora 1.0Sora 2.0
最长时长60 秒3 分钟
最高分辨率1080p4K
时间一致性良好极好
物理模拟偶有穿帮基本准确
角色一致性经常漂移稳定
音频同步不支持支持(Beta)

数字很好看,但真正让行业震动的是三个新功能:

1. 角色锁定(Character Lock)

上传一张参考图,Sora 2.0 可以在整段视频中保持该角色的外观一致性。这意味着你可以用同一个"AI 演员"拍摄一系列连贯的内容。短视频创作者和独立电影人已经开始疯狂测试。

2. 场景延伸(Scene Extension)

给定一段实拍视频,Sora 2.0 可以向前或向后延伸画面,且风格、光照、运镜完全匹配。这对后期制作来说是革命性的——你可以把一个 5 秒的镜头自然延伸到 30 秒。

3. 多镜头叙事(Multi-Shot Narrative)

这是最惊艳的功能。你可以用一段文字描述一个包含多个镜头的故事,Sora 2.0 会自动规划镜头切换、景别变化和叙事节奏。生成的结果不再是一个"动态图片",而是一个有起承转合的短片

一位导演朋友看完 Demo 后说:“这不是工具升级,这是整个行业的操作系统在换代。”


中国选手:快手可灵 2.0 与字节即梦

就在 Sora 2.0 发布的同一周,国内两家视频生成产品也有大动作:

快手可灵 2.0 更新了画面质量和运动控制能力,最关键的改进是中文语义理解——终于不需要用英文 prompt 才能获得好效果了。对于中文创作者来说,这个改进的实际价值可能比任何技术参数都大。

字节即梦 则走了一条差异化路线,主打"以图生视频"和"电商场景视频"。用一张产品图就能生成带有运镜、光效和模特展示的商品视频,据说已经在抖音电商内部大规模测试。

我们的判断

视频生成赛道的竞争格局正在形成:Sora 做好莱坞,可灵做 B 站,即梦做抖音。三者的目标用户和使用场景已经开始分化,这比所有人都做同一件事要健康得多。


音乐 AI:Udio 的 7 亿美元融资说明了什么

Udio 本周宣布完成 7 亿美元 B 轮融资,估值达到 35 亿美元。对于一个成立仅 18 个月的音乐生成公司来说,这个数字令人咋舌。

但如果你实际用过 Udio 的最新版本,你会理解投资人的逻辑:

  • 生成的歌曲已经可以直接上架流媒体平台,音质和编曲水平接近专业制作
  • 支持 30+ 种音乐风格,从古典到电子到中国风
  • 新增"歌词适配"功能,给定一段歌词,AI 会自动编曲并生成人声演唱

Suno 作为 Udio 的主要竞争对手也没闲着——本周更新了 V4.5 版本,重点提升了中文歌曲的咬字和情感表达。两家的竞争正在推动音乐 AI 以惊人的速度进化。

一个有趣的数据:Spotify 上已经有超过 50 万首完全由 AI 生成的歌曲,月播放量超过 1 亿次。版权法还没来得及跟上,市场已经跑起来了。


多模态进展:看见、听见、理解

除了视频和音乐,本周在多模态 AI 领域还有几个值得关注的进展:

ElevenLabs 发布 Voice Design 2.0 —— 不再需要上传参考音频,你可以用文字描述想要的声音特征(“35岁男性,低沉磁性,略带沙哑,播音腔”),AI 会从零生成一个全新的声音。

Meta 发布 ImageBind 2 —— 一个能够将文本、图像、音频、视频、深度信息和 IMU 数据统一到同一个嵌入空间的模型。这听起来很学术,但它为"真正理解世界"的 AI 打下了关键基础。

Midjourney 推出实时编辑模式 —— 在生成的图片上直接涂抹、圈选、标注,用自然语言告诉 AI 你要修改什么。从"生成-不满意-重新生成"变成了"生成-局部调整-完成",工作流效率大幅提升。


数字与趋势

  • 全球 AI 视频生成市场规模预计在 2026 年达到 18 亿美元,同比增长 340%
  • 使用 AI 辅助创作的 YouTube 频道数量在过去 6 个月增长了 5 倍
  • AI 生成内容在社交媒体上的平均互动率比纯人工内容高 23%(这个数据值得警惕)
  • 好莱坞编剧工会与制片方达成新协议:AI 可以用于预制作阶段,但最终创作决策权必须由人类持有

编辑手记

我们正站在一个奇妙的节点上:AI 创作工具的能力已经超过了大多数人的想象力

限制创作的瓶颈不再是技术,而是你能不能想到一个好故事、一个好画面、一个好旋律。这对真正有创意的人来说是天大的好消息——工具已经准备好了,就等你的 idea。

但对于那些一直靠"技术门槛"吃饭的人来说,寒冬可能真的来了。

下周见。


本文由 AIEII 编辑部撰写。转载请注明出处。

广告合作联系
立即联系 →
加入会员申请
了解详情 →
← AI 绘画工具横评 … AIEII 周刊正式上线,免费订阅获取 AI 前沿洞察 →
💬 Comments
4 min read