智谱推出AI生成视频新清影：支持超高清，自带音效

2024-11-08

11月8日，今日，智谱视频生成大模型产品清影重要升级，支持生成 10s、4K、60 帧超高清以及人物表演细节，即日起在智谱清言app上线。此外，智谱宣布本月将上线从视频直接生成音效的模型，意味着“默片 Sora”将进入“有声电影时代”。

3 个月前，作为国内首个面向公众开放的视频生成产品，清影上线清言App，只需一段指令或图片，30 秒就能生成 AI 视频。为人类影视创作带来了更多创新玩法，如广告制作、短视频、表情包梗图等。

清影发布后不久，GLM 技术团队先后开源了 CogVideoX 2B 和 5B 版本两个模型，可在消费级显卡上流畅运行，性能领先的 CogVideoX-5B 模型自开源以来受到广泛的关注，并衍生出如 CogVideoX-factory 等大量的二次开发项目。

基于 CogVideoX 模型的最新技术进展和我们最新推出的音效模型 CogSound，新清影在以下 5 个方面实现了提升。

模型能力全面提升：在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力明显增强。

4K超高清分辨率：支持生成 10s、4K、60 帧超高清视频，视觉体验拉到极致，动态画面更加流畅。

可变比例：支持任意比例的图像生成视频，超宽画幅也能轻松 Hold 住，从而适应不同的播放需求。

多通道生成能力：同一指令/图片可以一次性生成 4 个视频。

带声效的AI视频：新清影可以生成与画面匹配的音效了。音效功能将很快在本月上线公测。

新清影即日起在智谱清言 App 上线：https://chatglm.cn/video

为了支持广大开发者，智谱也同时将 CogVideoX v1.5-5B、CogVideoX v1.5-5B-I2V 进行了开源。开源地址：https://github.com/thudm/cogvideo