对标Sora！清华团队发布视频大模型Vidu，可生成16 秒、1080P 视频

清华大学与生数科技在中关村论坛未来人工智能先锋论坛上发布了中国首个长时长、高一致性、高动态性视频大模型Vidu，标志着中国在视频生成技术领域取得重要进展。该模型采用创新性的U-ViT架构，能一键生成高清视频内容，具备高时空一致性和丰富的想象力。

Vidu是中国首个长时长、高一致性、高动态性视频大模型

融合Diffusion与Transformer技术，能一键生成长达 16 秒、1080P的高清视频内容。

不仅能模拟真实物理世界，还具备丰富的想象力，支持多镜头生成

Vidu是由生数科技联合清华大学发布的中国首个长时长、高一致性、高动态性视频大模型。

其快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。

Vidu的问世代表了生数科技在多模态原生大模型领域的持续创新能力和领先性，面向未来，灵活架构将能够兼容更广泛的模态，进一步拓展多模态通用能力的边界。