0

0

Lego-Edit— 小米开源的图像编辑框架

心靈之曲

心靈之曲

发布时间:2025-09-21 10:31:17

|

424人浏览过

|

来源于php中文网

原创

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Lego-Edit— 小米开源的图像编辑框架Lego-Edit是什么

lego-edit 是由小米研究院推出的开源指令驱动图像编辑框架,依托多模态大语言模型(mllm)的强大泛化能力,实现对图像内容的智能化、灵活化修改。该框架采用“模型即工具”的设计理念,内置多个在少量数据上高效训练的专用模型,构成一个可协同工作的工具集合,支持多种图像操作。通过三阶段渐进式强化学习训练方式——先监督微调(sft),再特定任务上的强化学习(rl),最后引入海量无标注指令进行扩展性rl训练——显著提升了系统对多样化、复杂指令的理解与执行能力。lego-edit 具备出色的泛化性能,在多个权威基准测试中达到领先水平,支持局部编辑、全局调整及多步连续操作,并可通过掩码精确指定编辑区域。此外,新工具可无需重新训练直接接入系统,极大增强了功能扩展性与实用性。

Vinteo AI
Vinteo AI

利用人工智能在逼真的室内环境中创建产品可视化。无需设计师和产品照片拍摄

下载

Lego-Edit的主要功能

  • 多样化的图像编辑能力:能够根据自然语言指令完成复杂的图像修改任务,涵盖局部替换、整体风格迁移以及多轮连续编辑,适用于多种实际应用场景。
  • 开放域指令理解能力:基于多模态大语言模型(MLLM),可准确解析用户输入的自由形式指令,即使面对未曾训练过的描述也能通过语义推理完成相应操作。
  • 高效的模型级工具集成:框架集成了多个轻量且专精的图像处理模型,如色彩调节、对象生成、背景替换等,MLLM 可智能调度这些工具以实现细粒度控制。
  • 即插即用的新工具支持:新增编辑功能模块时,无需对主模型进行额外微调或重训,即可被系统识别和调用,便于快速迭代和定制化开发。
  • 精准的区域控制机制:支持用户上传掩码图来明确指定需编辑的像素范围,确保修改仅作用于目标区域,避免干扰其他图像内容,提升编辑精度。
  • 开源开放与易部署性:代码遵循 Apache 2.0 开源协议,模型权重采用 CC BY-NC 4.0 协议发布,提供完整的 Gradio WebUI 界面,用户只需简单配置环境并下载预训练模型即可快速上手使用。

Lego-Edit的技术原理

  • 模块化工具架构设计:Lego-Edit 将各类图像操作封装为独立的“模型级工具”,每个工具专注于特定任务(如去噪、上色、修复等),形成可组合使用的功能库。
  • 多模态大语言模型为核心控制器:MLLM 作为“大脑”负责理解用户指令、分析图像内容,并决策调用哪个工具、何时调用以及如何组合多个步骤完成复杂任务。
  • 三阶段渐进式训练流程
    1. 监督微调(SFT):使用标注好的指令-操作对训练模型掌握基本编辑逻辑;
    2. 任务导向强化学习(RL):在具体编辑任务中引入奖励机制,优化模型的工具选择与执行策略;
    3. 大规模无监督RL增强:利用大量未标注的人类指令数据,结合强大的批评模型(critic model)提供反馈信号,进一步提升泛化能力。
  • 掩码引导的精确编辑:允许输入二值掩码图像,明确指示编辑作用区域,使系统能精准定位并修改指定部分,实现精细化操控。
  • 零样本工具集成能力:得益于统一的接口设计与语义理解能力,新加入的工具只需提供功能描述即可被 MLLM 自动识别和调用,无需额外训练。

Lego-Edit的项目地址

Lego-Edit的应用场景

  • 创意设计辅助:设计师可通过自然语言快速实现构图调整、元素替换、风格迁移等操作,加速创意落地过程,激发更多灵感可能。
  • 数字内容生产:广泛应用于短视频制作、广告海报设计、社交平台图文编辑等领域,帮助创作者高效处理图像素材,提升内容质量与产出效率。
  • 电商平台图像优化:商家可用于自动美化商品图片,例如去除水印、改善光照、更换背景或添加虚拟展示环境,从而提升转化率。
  • 教育教学工具:作为教学演示平台,帮助学生理解图像处理原理,培养AI时代的数字创作能力;教师也可用于快速生成教学配图。
  • 个人影像美化:普通用户可轻松实现人像美颜、背景虚化、旧照修复等功能,满足日常拍照修图需求,便于分享至社交媒体。
  • 游戏与VR内容生成:在虚拟现实游戏开发中,可用于快速生成角色皮肤、场景贴图、特效元素等资源,缩短美术资源制作周期,丰富视觉表现力。

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1024

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

66

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

449

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

2

2026.01.19

apache是什么意思
apache是什么意思

Apache是Apache HTTP Server的简称,是一个开源的Web服务器软件。是目前全球使用最广泛的Web服务器软件之一,由Apache软件基金会开发和维护,Apache具有稳定、安全和高性能的特点,得益于其成熟的开发和广泛的应用实践,被广泛用于托管网站、搭建Web应用程序、构建Web服务和代理等场景。本专题为大家提供了Apache相关的各种文章、以及下载和课程,希望对各位有所帮助。

406

2023.08.23

apache启动失败
apache启动失败

Apache启动失败可能有多种原因。需要检查日志文件、检查配置文件等等。想了解更多apache启动的相关内容,可以阅读本专题下面的文章。

930

2024.01.16

http500解决方法
http500解决方法

http500解决方法有检查服务器日志、检查代码错误、检查服务器配置、检查文件和目录权限、检查资源不足、更新软件版本、重启服务器或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

364

2023.11.09

http请求415错误怎么解决
http请求415错误怎么解决

解决方法:1、检查请求头中的Content-Type;2、检查请求体中的数据格式;3、使用适当的编码格式;4、使用适当的请求方法;5、检查服务器端的支持情况。更多http请求415错误怎么解决的相关内容,可以阅读下面的文章。

410

2023.11.14

PS使用蒙版相关教程
PS使用蒙版相关教程

本专题整合了ps使用蒙版相关教程,阅读专题下面的文章了解更多详细内容。

23

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 2.8万人学习

Git版本控制工具
Git版本控制工具

共8课时 | 1.5万人学习

Git中文开发手册
Git中文开发手册

共0课时 | 0人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号