清影AI视频生成
当前位置:首页>AI工具>AI训练模型>Matrix-Zero:昆仑万维发布的AI世界模型,支持单张图生成3D世界

Matrix-Zero:昆仑万维发布的AI世界模型,支持单张图生成3D世界

Matrix-Zero是什么?

Matrix-Zero 是昆仑万维发布的世界模型,包含两款子模型:3D 场景生成大模型可交互视频生成大模型。3D 场景生成大模型能将图片转化为可自由探索的 3D 场景,具备全局一致性、支持不同风格输入、动态场景生成等亮点。可交互视频生成大模型则提供以用户输入为核心的视频生成方案,支持实时互动,具备精准控制的 action model。该模型将推动影视制作、游戏开发等领域的创新,提升内容生产效率。

Matrix-Zero:昆仑万维发布的AI世界模型,支持单张图生成3D世界

Matrix-Zero的主要特性

Matrix-Zero包含两款子模型:3D 场景生成大模型可交互视频生成大模型

1、3D 场景生成大模型

昆仑万维自研的 3D 场景生成大模型能够将用户输入的图片转化为可自由探索的真实 3D 场景。其亮点包括:

  • 全局一致性:生成的 3D 场景在各个角度和位置保持一致,不会出现前后不一致的现象。
  • 自由探索:支持在场景中进行任意方向的长距离、大范围探索,为电影、短剧等场景镜头生成提供更多可能性。
  • 风格迁移:能够根据输入图片的风格(如卡通或写实)生成相应风格的 3D 场景,并支持风格迁移。
  • 动态场景生成:可生成光照、水花、云雾等动态效果,符合物理规律,后续可用于构建更真实的 3D 场景和视频。

该模型包含两个核心模块:场景布局生成模块和纹理生成模块。几何生成模块借助可微渲染和扩散模型技术,创造出与输入图片一致的 3D 场景布局;纹理生成模块则在用户运动时不断补全场景缺失区域,确保用户在任何位置、任何角度都能看到合理、一致的场景。

2、可交互视频生成大模型

昆仑万维的可交互视频生成大模型建立在先进的生成式视频模型之上,结合自主研发的用户交互模块,实现以用户输入为核心驱动的空间智能视频生成方案。其特点包括:

  • 精准控制:能够根据用户实时输入(如键盘、鼠标操作)生成互动视频效果,增强对视频内容中视角移动的精确控制。
  • 多模块支持
    • 离散运动控制模块:解析用户输入的离散控制信号(如前进、跳跃、后退等),转化为运动轨迹,影响视频中的对象行为。
    • 连续视角控制模块:解析鼠标或其他输入设备的连续控制信号,响应实时输入,确保视角变换的平滑性和一致性。
    • 3D 场景位置追踪模块:基于三维空间定位技术,提升视角移动时的位置稳定性,减少画面跳转问题。
    • 滑动窗口机制:引入时间序列中的历史输入信息,优化控制响应的平滑度,减少输入延迟,提高交互流畅性。

该模型能够高效生成高质量的视频内容,确保视频的流畅性、一致性和合理性,为虚拟环境、交互式应用以及沉浸式体验提供强大支持。

Matrix-Zero 的应用场景

  • 影视制作:Matrix-Zero可用于快速生成电影、短剧等影视作品的场景,提升创作效率,减少传统 3D 建模的高成本和耗时问题。
  • 游戏开发:Matrix-Zero为 3D 游戏场景的快速建模提供高效解决方案,支持不同风格的场景生成,提升游戏开发的效率和质量。
  • 具身智能:Matrix-Zero可用于模拟场景的快速搭建,为具身智能的训练和测试提供虚拟环境。
  • 交互式应用:Matrix-Zero通过可交互视频生成大模型,支持用户实时输入生成互动视频效果,可用于虚拟环境、沉浸式体验等场景,提升用户交互的多样性。
  • 教育与培训:Matrix-Zero可以创建沉浸式的教学场景,支持不同风格的场景生成和动态效果,提升学习体验。
  • 虚拟旅游:Matrix-Zero为用户提供可自由探索的虚拟旅游场景,支持不同风格的图片输入和风格迁移,增强旅游体验。

如何体验Matrix-Zero?

据昆仑万维官方消息,Matrix-Zero世界模型预计4月份上线。

©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。
笔灵AI论文
0 条回复 A文章作者 M管理员
    暂无评论内容
error: