-
混元图生视频模型 - 腾讯开源的AI视频生成模型
混元图生视频模型是腾讯开源的一个图像转视频生成框架,能够将静态图像转换为生动的视频内容。用户只需上传一张图片并简单描述动态效果,即可生成五秒的短视频。它结合了先进的视频生成技术和多模态大语言模型,支持多种角色和场景的生成,包括写实视频、动漫角色和 CGI 角色等。- 712
- 0
-
SkyReels-V1:昆仑万维开源的AI短剧创作视频生成模型
SkyReels-V1 是昆仑万维开源的中国首个面向AI短剧创作的视频生成模型,专注于影视级人物表演、表情生成和动作模拟。它能够精细控制人物的口型、表情和肢体动作,提供33种人物微表情和400多种自然动作组合,模拟真实的情感表达。- 3.7k
- 0
-
Step-Video-T2V:阶跃星辰推出的开源视频生成大模型
Step-Video-T2V是阶跃星辰与吉利联合开源的一款高性能视频生成大模型,具备300亿参数量,能够生成540P分辨率的高质量视频。它支持复杂运动场景、精准镜头控制和生动人物生成,能够根据文本输入生成符合物理规律的视频。- 5.8k
- 0
-
Video-XL:智源等推出的小时级超长视频理解大模型
Video-XL是一款创新性的长视频理解大模型,与现有的短视频模型相比,Video-XL在处理长视频时表现出卓越的效率和准确性,适用于电影摘要、广告检测、异常事件识别等多种应用场景。通过深度优化的视觉压缩和上下文建模技术,Video-XL能在单块80G显卡上支持2048帧的视频分析任务,并在主流视频理解基准上取得领先成绩。- 3.7k
- 0