StreamingT2V-AI视频生成模型，支持生成2分钟视频

StreamingT2V是什么？

StreamingT2V是由Picsart AI Research等团队联合发布的一款创新的AI视频生成模型。它能生成长达1200帧、时长为2分钟的视频，大大超越了先前模型的时长限制，如Sora模型。StreamingT2V以其开源性和与其他模型如SVD和animatediff的兼容性，标志着AI视频生成技术的一大步进。

StreamingT2V的主要特性

长时长视频生成能力：StreamingT2V能够生成高达1200帧、时长为2分钟的视频，这在AI视频生成技术中是一个显著的进步，大大超越了先前模型的时长限制。
高质量和时间一致性：该模型专门设计来保持视频在长时间生成过程中的质量和一致性，避免了常见的视频质量下降、表现生硬或停滞等问题。
自回归视频生成技术：StreamingT2V采用自回归技术连续生成视频内容，允许模型在生成新的视频帧时利用已生成的帧作为参考，从而确保视频的流畅和一致性。
模块化设计：模型包括条件注意力模块（CAM）和外观保留模块（APM），这些模块分别负责短期和长期记忆，帮助模型在生成过程中保持细节和场景的连续性。
开源与兼容性：作为一个开源项目，StreamingT2V不仅可以单独使用，还可以与其他流行的视频生成模型如SVD和animatediff等无缝集成，进一步促进了开源生态系统的发展。
支持无限长度视频生成：虽然当前实现可生成长达2分钟的视频，但理论上模型能够生成无限长度的视频，为未来的应用提供了巨大的潜力。