Step1X-Edit是什么?
Step1X-Edit是阶跃星辰推出的开源图像编辑大模型,性能达到开源 SOTA。该模型总参数量为 19B(7B MLLM + 12B DiT),具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持 11 类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。

Step1X-Edit的主要能力
- 语义精准解析:支持自然语言描述的复杂组合指令,无需模板,能够灵活应对多轮、多任务编辑需求。同时,支持对图像中文字进行识别、替换与重构。
- 身份一致性保持:编辑后能稳定保留人脸、姿态与身份特征,适用于虚拟人、电商模特、社交图像等高一致性场景。
- 高精度区域级控制:支持对指定区域进行文字、材质、色彩等定向编辑,保持图像风格统一,控制能力更精细。
Step1X-Edit的应用场景
1. 电商领域
- 虚拟模特生成:通过自然语言指令,将商品图像中的模特替换为虚拟模特,或者为商品添加背景和场景。
- 商品图像优化:快速调整商品图像的风格、色彩或背景,提升视觉效果,节省拍摄成本。
2. 创意设计
- 背景替换与风格迁移:用户可以通过简单指令将照片背景替换为海滩、山脉等场景,或者将图像风格转换为动漫、油画等。
- 主体添加与移除:在图像中添加或移除物体,例如在风景图中添加一只猫,或移除广告牌。
3. 社交媒体
- 照片美化与个性化编辑:用户可以轻松美化照片,调整肤色、添加滤镜或改变文字内容,提升内容吸引力。
- 创意内容生成:生成具有创意的图像,如将照片中的宠物替换为其他动物,或改变场景风格。
4. 影视后期
- 特效制作:在影视后期中添加或移除物体,调整场景色调,节省后期制作成本。
5. 虚拟人与社交图像
- 身份一致性保持:在编辑虚拟人或社交图像时,保持人脸、姿态和身份特征,适用于虚拟人、电商模特等高一致性场景。
7. 游戏开发
- 角色与场景生成:快速生成游戏角色、场景和道具,调整装备或风格,减少美术资源开发时间。
Step1X-Edit的开源信息
- Github仓库:https://github.com/stepfun-ai/Step1X-Edit
- 模型地址:
- 技术报告:https://arxiv.org/pdf/2504.17761
©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。
