阶跃星辰开源图像编辑大模型Step1X-Edit,性能达开源SOTA

阶跃星辰今日宣布开源图像编辑大模型Step1X-Edit,其性能达到开源领域先进水平。该模型总参数量为19B,结合7B多模态大语言模型(MLLM)和12B扩散变换模型(DiT),具备语义精准解析、身份一致性保持及高精度区域级控制三项核心能力,可支持文字替换、风格迁移、材质变换等11类高频图像编辑任务。

Step1X-Edit能够精准解析自然语言指令,实现多轮、多任务编辑,并保持人脸、姿态等身份特征的一致性。此外,该模型支持对指定区域进行精细化控制,确保图像风格统一。开发者可通过Github、HuggingFace等平台获取开源代码及技术报告。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1