北大-兔展 AIGC 联合实验室开源的 Sora 复现计划,从 v1.0 的 2+1D 架构演进到 v1.5 的 SUV 稀疏 DiT + WFVAE,在 8B 参数量下达到接近 HunyuanVideo 的生成质量。
一、项目全景
Open-Sora-Plan 由北京大学-兔展 AIGC 联合实验室发起,华为、鹏城实验室深度参与,目标是开源复现 OpenAI Sora 的视频生成能力。项目经历了 5 个大版本迭代:
| 版本 | 架构 | 关键特性 | 分辨率上限 |
|---|---|---|---|
| v1.0 | 2+1D DiT | CausalVideoVAE、基础 T2V | 65×512×512 |
| v1.1 | 2+1D DiT | ShareGPT4Video 长视频标注 | 221×512×512 |
| v1.2 | Dense 3D DiT | 全 3D 注意力、I2V 支持 | 93×720p |
| v1.3 | Skiparse DiT</ |