马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
×
品玩3月9日讯,小红书Super Intelligence团队近日发布其图像编辑模型FireRed-Image-Edit的1.1版本,在功能与性能上实现显著升级。该模型现已开源,提供代码、技术报告与模型参数。 新版本在多领域展示出强大编辑实力。其角色身份保持(ID一致性)技术在开源领域表现优异,确保人物主体在复杂编辑后依然可被识别。模型支持自由组合十余种元素,并配备智能Agent自动处理裁剪与拼接。同时,模型在专业级人像美妆、基于参考的高保真字体风格生成以及老照片修复等方面均具备优秀能力。 在工程层面,模型实现了训练与推理效率的显著优化。通过集成模型蒸馏、量化与静态编译等加速方案,模型在仅需30GB显存的条件下,即可实现4.5秒的端到端生成。团队开源了完整的LoRA训练代码,并优化了训练流程,通过提前离线抽取特征等方式大幅提升了训练速度。模型还提供对ComfyUI节点与GGUF格式的原生支持,便于生产环境部署。 技术报告通过丰富的对比案例,展示了模型在处理复杂元素融合、多参考图换装、精细化人像编辑及创意封面设计等任务上的卓越效果。该模型基于骨干无关的架构设计,其编辑能力可迁移至其他文生图基础模型。
|